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Titel : ' Relconfigurierbare Elemente 

15 



Definitionen 

20 : Rekonfigurierbare Elemente werden abhSngig von der auszufflhrenden Applikation 
unterschiedlich und applilcationsentsprechend ausgestaltet. 

Die Aufgabe der Erfindvmg besteht darin, Neues fttr die gewerbliche Anwendung 
bereitzusteXlen . 

25 

Die LOsimg der Aufgabe wird unabh&tigig beansprucht . Bevorzugte 
Ausftthrungsformen finden sich in den mteransprQchen. 

Ttoter einer rekonf igurierbaren Arcbitektur werden vorliegend Ba\i8teine (VPD) 
30 znit kon£igurierbarer Funktion und/ Oder Veziietzimg verstanden, insbesondere 
intisgrierte Bausteine init einer Mehrzahl von ein- oder mehrdimensional 
. V ahgeordheten ari thine t is chen und/ oder logiscben .\md/oder analogen und/oder . 
speichemden und/oder intern/ extern viernetzendeii Baugriippen, die direkt oder 
durch ein Bussystem miteinander verbunden sind. . 

35 

Zur Oattung dieser Bausteine zahlen insbesondere systolische Arrays, 
neuronale Netze, Mfehrprozessor Systane, Prozessoren mit mehreren Rechenwerken 
und/oder logischen Zellen und/oder konsaunilcativen/peripheren ZelXen (10), 
Vemetzungs- und Netzwerkbausteine wie z.B. Crossbeur-Schalterr ^benso wie 
40 bekannte Bausteine der Gattting FPGA, DPGA, Chameleon, XPDTER, etc. . 

Hingewiesen wird insbesondere in dieseia Zusanmienhang au£ die folgenden 
Schutzrechte xmd Anmeldvtngen desselben Anmelders: 

P 44 16 881.0-53, DE 197 81 412.3, DE 197 81 483.2, DE 196 54 846.2-53, 
DE 196 54 593.5-53, DE 197 04 044.6-53, DE 198 80 129.7, DE 198 61 088.2-53, 
45 DE 199 80 312.9, PCT/DE 00/01869, DB 100 36 627.9-33, DE 100 28 397.7, 

DE 101 10 530.4, DE 101 11 014.6, PCT/EP 00/10516, EP 01 102 674.7, DE 196 51 
075.9-53 , DB 196 54 846.2-53, DE 196 54 593.5-53 , DE 197 04 728.9, DE 198 
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07 872.2 , DE 101 39 170.6 , DE 199 26 538.0 , DE 101 42 904.5 , , DE 102 06 
653 .1; , ; DE 102 06 857 .7 ; DE. 100 28 .397 .7 V DE 101 10 . 530.4 / pE 102 02. 
044*2 , DB 101 29 237.6-53 , DE 101 42 904.5 , DE 100 50 442.6 , DE 101 35 
210.7-53 , EP 02 001 331.4 , 60/317,876 . Diese sind hiermit zu 
5 Of£ezibcirungszwecken volluxaf&iglich eingeglledert . 

Die o.g. Architektur wird beisplelhaft zur Verdeutllchung herangezogen und im 
folgenden VP0 genaxmt. Die Architektvir besteht aus beliebigen arithmetischen, 
logischen (auch Speicher) und/oder Speicherzellen tind/oder Vemetzungszellen 

10 und/oder konmuin ikativen/peripheren (10) Zellen (PAEs) , die zu einer ein^ Oder 
mefardimensionalen Matrix (PA) angeordnet eein lc6nnen, wobei die Matrix 
unterschiedliche, beliebig ausgestaltete Zellen aufweisen kann; auch die 
Bussystezoe warden dabei als Zellen verstemden* Der Matrix clLs ganzes Oder 
Teilen devvon .zugeordnet ist eine Konfigurationseixilieit (CT, Ladelogik) ^ . die 

15 die Vemetzung imd Funktion des PA konfiguriert. Die CT kann z. B. als 

dedizierte Einheit gem. PACT05, PACTIO, PACT17, auegestaltet sein oder als 
Host-Mikroprozessor nach P 44 16 881.0-53 , DE 102 06 856.9 dem PA 
zugeordnet bzw. mlt oder durch solche realisiert sein. 

20 

Stand der Technik 

Unterscliledliche PAE-Strukturen sind nach dem Stand der Technik belcannt. Die 
gebrauchlichsten sind durch DE 196 51 075.9-53 , DE 100 50 442.6 , sowie 
25 Chameleon CS2112 definiert. Weiterhin soil au£ die ]3e3cannten FPQA-Zellen 
verwiesen werden. 

Aus dem universitSren Timfeld sind Zellstrukturen wie die DPGAs, RawMachine 
(DeBuon) r KressArrays (Kress, Uni Kaiserslautem) , XFOTER (fiartenstein, Uni 
30 Kaiserslautem) , sowie weitere Struktxiren bekannt. 

Die naclifolgend beschriehenen Erweiterungen,! die fOr alle vorgenaonten 
Strukturen nutzbcuc sind, verbessem die Nutzbarkeit der Architekturen uhd 
PAE-Strukturen in koirqplexen insbesondere auch stark sequentiellen und/oder 
35 wenig datenfluSorientierten Anwendxmgen . Weiterhin wird der An6chlu£ an 
exteme Eiziheiten (z.B. Speicher tind/oder Peripherie) vereinfacht und 
homogenisiert . 

40 

Indirekte Konfigiuration 

In einer besonderen AusfUhrung einer PAB (IPAE) wird diese oder eine Gruppe 

von PAEs mit einera Speicher (RRAM) , vorzugsweise einer RAM-PAE gekoppelt . Die 
IPAE weist einen eigenen intemen Seguenzer auf oder ist mit einem Sequenzer 
45 bzw. Kicrocontroller mit einem bevorzugt limitierten, d.h. mit einer 

vergleichsweise geringen Anzahl an unterschiedlichen mOglichen Befehlen, 
ahnlich wie bei RiSC-Prozessozren und/oder bevorzugt vollstSndigen 
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Befehlssatz (vgl. ARC Microprocessor) gelcoppelt. Hit anderen Worten wird 
• . bevbrzugt . ein RISC Prozessbr mit einem xnbglichst kleinen Befehlssatz, .der . 
jedoch berecbnungstheoretisch vollst&ndlg ist, verwendet« In einer 
Ausftihningsvariante kann der Sequenzer auch durch elhe Kohf Iguratlon elner 
5 Oder mehrerer PAKs gebildet werden. Es kann der Sequenzer in seiner Fxinktibn 
und seinem Ablaufverhalten konfigturierbar ausgestalteb sein (wie 
beispielsweise nach dem Stand der Technik Isekaxmt, z.B. durch EPS448 von 
Altera [ALTERA Data Book 1993] )« Der Sequenzer /Microcontroller kann auf 
ZustSnde (z.B. Statu8signcU.e, Ereignisse) in der IPAE und/oder auf ZuseSnde 

10 . (z.B. auch Trigger) anderer PAEs, die niit der IPAE verbunden sind (z.B. tJber 
ein Bussystem) , resigieren. In einem Register der IPAE wird ein Pointer auf 
einen RRAM Speicherinbalt konfiguriert, z. B« kann der ProgramPointer Rpp 
kann wMhrend des Reset-Zyklus auf die Startadresse des Codes gesetzt werden. 
Ein Adressgenerator im Sequenzer liest den durch den Pointer referenzierten 

15 Speidherinhalt aus dem RRAM und schreibt diesexi (oder einen Tell dessen) 
entweder in ein, beispielsweise durch den Speicherinhalt adressiertes, 
Konf Igurationsregister einer adressierten FAE oder nutzt den Speicherinhalt 
als Instxiiktion fUr eine nachste Verarbeitung. Der Pointer wird durch den 
Adressgenerator entsprechend der dblichen Arbeitsweise von Adresspointem 

20 inkrementiert und/oder dekrementiert und/oder bei Sprungbefehlen (JUMP, CALL, 
RETURN) neu gesetzt. Insoweit stellt der Speicher RRAM einen Codespeicher und 
in einer bevorzugten Ausftihrung auch Datenspeicher fOr einen Sequenzer zur 
VerfUgung und/oder wird als solcher genutzt. Der Sequenzer kann frei Code aus 
dem Speicher (RRAM) lesen und in einer bevorzugten AusfOhrung auch Daten aus 

25 dem Speicher lesen oder in den Speicher schreiben. Insofem stellt der 
Speicher auch einen Datenspeicher flir den Sequenzer dar. 

Der RRAM Speicherinhalt "kann von einer tibergeordneten Konfigurationseinheit 
(CT) geladen werden. In einer erweiterten AusfOhrung kann der Speicherinhalt, 
30 ggf • auch von der IPAE selbstandig, zusStzlich oder alternativ aus einem . 

anderen (beispielsweise extemen) Speicher geladen oder an diesen geschrieben 
werden, z.B. tiber einen Anschlufi an ein. Fr^ 

In einer Ausftlhrungsvariante kann der Speicher iind/oder die IPAE einen 
35 direkten AnschluS (EXTBUS) an ein extemes RAM und/oder exteme lO besitzen. 
In einer dabei besonders bevorzugten Ausgestaltung kann der EXTBUS tiber eine, 
ggf. dedizierte, Verbindung des PAE-Bus systems an eine Interface-Baugruppe 
(lOAG) wie beispielsweise aus PACT03 oder PACT15 bekannt realisiert sein. Die 
Ansteuerung von Speicher (RAM) und/oder Peripherie (10) erfolgt dabei 
40 bevorzugt durch die Interface-Baugiruppe. 

In elner besonders bevorzugten Ausgestaltung kann der RRAM selbstebidig Code 
und/oder Daten fUr den Sequenzer tSber den EXTBUS axis dem oder einem extemen 
RAM laden. Diese Funktion kann durch eigenstSndige, im RRAM i!i^>lementierte 
45 Oder implementierbare Adressgeneratoren realisiert werden. Beispielsweise 

eignen sich DMA-Kontroller besonders fOr diese Aufgabe, indem sie blockweise 
Daten zwischen den speichem kopieren. Der Adressraum der zu lesenden Daten 
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imd der Zieladressraum wlrd entsprechend gesetzt und der Kopiervorgang wird 
gestartet.. pas Setzeh kann durch die IPAE erfolgen... . 

In etner hiardwarefliiasig aufwendigeren Lfisung kaim die Funktion durch eine 
5 in^lementierte MezaorvManagemenUnit (M^) realisiert sein, deren aXlgemeine 
FunJctioxisweise durch den Stand der Technik per ee definiert und belcannt ist. 
Vorliegend arbeitet die toevorzugte ma hier wie folgt: 

Der von der MMQ veantfaltete RRAM Speicher ist in mehrere Seiten <Pagiss> 
10 aufgeteilt. Jede Page enthait Da ten eines virtuellen Speicherraumes innerhalb 
elnes extemen Speichers. Beispielsweise kOxmen die hexadezixnalen BRAM- 
Adressen OxOaOO. .OxOaff Daten des extemen Speichers an den Adressen 
O3dbdl320O.;0Dd3dl32ff enthalten. Zur Verwaltung der Adressuiasetzung wird eine 
. . AdressOlDersetzungseinheit verwendet, die vorzugsweise durch in der HRAM-Zelle 
15 vorgesehene Lookup-Tabellen realisiert ist/ Die MMD ist nun dazu 

vorgesehen/insbesondere einen groSen Speicherraum auf den sehr viel 
Kleiner en des RRAM zu {Ibersetzen. Dies geschieht vorliegend derart, dass 
Seiten je nach Bed£u:£ von dem groSen Speicherraum in den Kleinen kopiert 
werden. Sobald eine Seite nicht xnehr benatigt wird, kann diese gel^scht 
20 und/ Oder tOserschrieben werden. Wenn die Daten au£ der Seite verSndert wurden, 
wird die Seite bevorzugt vor dem L6schen/t)berschreiben in den groSen 
Speicherrraum zurCickgeschrieben. 

Die Adressumsetzungseinheit arbeitet dann derart, dass ein hdherwertiger Teil 
25 der physikalischen Adresse (also die Adresse der Seite) in dem Lookup- 

Speicher abgelegt wird und auf die entsprechenden Daten der Seite im RRAH 
zeigt, sobald die Seite innerhalb des kleinen Speidiers (RRAM) verfttgbar ist. 
Dadurch kann ein Zugriff auf die Seite erfolgen. Fehlt die Seite im RRAM, ist 
auch keine Referehz eingetragen. Zn diesem Fall muss die Seite erst von 
30 einem groSen (extemen) Speicherraum in den RRAH kopiert werden. Hierzu kann 
eine andere, bevorzugt aktuell ni^t verweaodete Seite gemfifi dem vorst^enden 
. . Ablatif Qberschrieben werd^. 

Das Kopieren kann dabei automatisiert, also ohne wesentliche Beteiligung 
35 durch den Sequenzer erfolgen, indem von der HOSXJ ein DMA-Kontroller 

angesteuert wird. Die erf indungsgemfifie MM(7 des hier offenbarten RRAH ist 
daher roit einer Ansteuervmg fUr einen DMA-Kontroller versehen vind/oder 
verbindbar. Diesem werden die entsprechenden Seitenadressen im RRAM vnd 
extemen RAM, sowie die SeitengrOSe durch die KMQ zur VerfOgung gestellt, z. 
40 B. indem sie in Register eingetragen werden. 

In einer mOglichen und applikationsabhangig ggf . bevorzugten AusfCttirung 
kdnnen mehrere EXaiBUS -Interface implementiert sein. 

45 

In einer mOglichen Ausftihrung ist der RRAM in mehrere Segmente unterteilt, 
die in unterschiedlichen Adressbereichen liegen. Die Segmente k6nnen 
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beisplelsweise fOr elnlge der folgenden Funktionen aufgeteilt seln bzw. 
aufteilbar sein und insbesohdere elhe Gr6Be aufwciseh, die.die 
In^Iementierung aller oder einigex der folgenden Funktionen . erni5gllcht sowie 
entsprechende Steuerungeu, die gegc^benenfal^ Bind;, bevbrzuigrt 

5 aber test implementlert slnd, besitzen: 

Sequenzer-ZCode-Speicher, Stack (z.B. £tir Registersatz) , Datenspeicber, Heap, 
IO-Pu££er, Puffer zu extemem BAM bzw. Cache, Itoolmp-^rabellen, 
Konf igurationen flir PAEs und/oder Busse, der Registersatz der IPAE, 
Je nach Funktion kdnnen dazu folgende Ansteuermechanismen vorgesehen und/oder 
10 konfiguriert sein; 

Seguenzer-/Code-speicher: Prograxnmzeiger auf die entsprechenden 
Spelcherstellen (Rpp) . 

Stack: Stackzeiger auf die oberste ^icherstelle des Stack (Rsp) , 
gegebenenfalls aucb ein FramePointer (Rfp), wie er nach dem Stand der Technlk 
15 (z. B. Intel Pentium) per se bekannt ist. 

Konfigurationen fOr PAEs und/oder Busse& Hierauf kann ein Zeiger innerhalb 
der CT und/oder - implement ierung8al>hSngig ein Zeiger innerhalb der 
Ronfigurationssteuerving der PAS zeigen. 

Registersatz der ZPAB: Sollte der Registersatz der PAB im Speicher 
20 untergebracht sein, wird dieser direkt durch die PAB bevorzugt 
hardwaretechnisch £est vorgegebenen adressiert. 

Die restlichen Speicherbereiche, wie Datenspeicher, Puffer, Tabellen etc. 
werden typischerweise und bevorzugt durch den Coiopiler oder Prograramierer 
25 aufg^baut. Die Adressierung dieser Bereiche erfolgt durch das auszufOhrende 
Programm und/oder Betrlebssystem imd wird innerhalb des Prograimnes und/oder 
Be triebssys terns, ggf • unter Zxihilfenahme der Regis tersatzes und der ALU des 
Sequenzers, berechnet. 

30 Der Registersatz der IPAB kann in einer besonderen Ausgestaltung ahnlich dem 
. Registersatz von Transputem als Stack organisiert sein. Dadiirch kann der 

Registersatz besonders klein und hardwaretechnisch effizient . realisiert . 

werden (typischerweise reichen 3 Register A, B und C aus) . Weiterhin ist aus 

der Transputertechnologie be3cannt, dass Compiler effizient mit elnem 
35 derartigen hardwaretechnisch kostengOnstigen Registersatz arbelten kannen. 

Ebenfalls kann der Registersatz optional im RRAM liegen. 

In einer AusftUuning kann und wird der RRAM als Kulti-Port Speicher ausgefiUurt 
sein. Hulti**Port Speicher erlauben den gg£. auch gleichzeitigen Schreib- 
40 tind/oder Lese-Zugriff durch mehrere Speicherzugriffselnheiten auf den' 
Spelcherlnhalt • Speicherzugriffselnheiten kOnnen beisplelsweise externa 
und/oder interne Peripherie, Prozessoren, andere PABs sein. Die Funktion von 
Hulti-Port Speichem ist nach dem Stand der Technlk ebenfalls bekannt. 

45 In einer besonderen AusfOhrung kann die XPAE mit dem RRAH als lokale und ggf. 
auch globale Ronfigurationseinheit ahnlich einer CT fUr. PAEs in der umgebung 
arbelten oder unter anderem diese Funlction mit erftUlen. Bevorzugt arbeltet 
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die PAB nach dem aus DB 196 54 846.2-53 belcaxmten Verfalireix bei der 
Verwendiirig als lokal Konfiguratiohseinheit;. Wird . die Pi^ :ads glbb^ . 
Konfigurationseinheit verwendet, Oder sind sehr vlele^lokale PABs zu 
konf isnMrierai, . wird bevor^ 54 593.5^-53 . 

5 verwendet, das eine FILMO-Funktlonalitat aufweist tmd daher sebr viele omd 
audi voneinander tinabh^gige Konfigurationen verwalten kann. 
Die IPAB adressiert* z. B. geeteuert durch den Seotueazer/ Microcontroller » 
Konfigurationen im RRAM \md Iconfiguriert diese an PASS und/oder sich Belbst 
und/oder bestixnmt den Ablauf des Sequenzers/Microcontrollers « Bevorzugt 

10 . findet hierbei eine Synchronisation xnit einer Qbergeordneten CT abnlich der 
bekannte Inter-CT-Protokolle (DB 198 07 872.2, DB 100 28 397.7 , DB 199 26 
538.0 ) statt. Die IPAB KRAH Schaltimg kann Konfiguration tlber eines der 
E3CFRAM-Interface selbst laden und/oder Konfigurationen von einer 
Obergeordneten CT Ober das CT Interface anfordem. pie Funktionsweise kann 

15 ahnlich der Rekonfigurationseinheit in DB 196 54 846.2-53 sein. Die 
Konfigurationsdaten ftlr die PASs werden durch die IBAM an die PABs 
weitergeleitet Oder in einer bevxirzugten Ausgestaltung direkt von RRAH. Zur 
Auf teilung der Daten im RRAM an mehrere PAEs kann dabei ein 
Busverteilverfahren ahnlich des in DB 101 10 530.4 beschriebenen SIME>- 

20 Bussys terns yerwendet werden. 

Mit anderen Worten ist die prinzipielle Arbeitsweise einer IPAE RRAM 
Verschaltung £Umlich einem Microcontrollersy-stem, des sen Busanbindung 
und/oder dessen Datentransfer und/oder dessen Progranmablauf ein» VPa-Systen 
25 entspricht. 

Bs wird insbesondere Schutz fOr IPAE-RRAM-Verschaltungen beansprucht, bei 
denen die IPAB und das RRAM jeweils als separate Funktionselemente (PAEs) 
eines rekonfigurierbaren Bausteins ausgestaltet sind lind typischerweise 
30 beliebige Verschaltungen und Funktionen ausflttxren kdnnen, aber jedoch 

speziell zum Einsatz der erf indungsgeinas beschriebenen Sequenzerstruktur aus 
IPAB \md RRAM. entsprechend konfigiuriert und verwendet werden kdnnen. Die 
kon€ig\iration erf olgt dabei bevorzugt durch die fibergebrdnete 
Konfigurationseinheit CT. 

35 

Ebenfalls wird Schutz beansprucht ftlr PAEs, die zusAtzlich zu ihrem Anschluss 
an die intemen Bussys teme des Arrays aus PAEs einen dedizierten Anschluss 
(lO-Channel) an ein Oberregionales Bus system aufweisen, das insbesondere 
Daten fiber lange Strecken innerhalb des Arrays Obertragt und/oder 

40 insbesondere direkten AnschluB an die Peripherie aufweist. Der Anschlufi an 
die Peripherie kann dabei direkt erfolgen, indem z. B. das Bussys tern bereits 
dpm s>eripheren Protokoll entspricht oder ftt>er entsprechende Protokollwandler 
zur Omsetzung des Protokolls erfolgen. Das dedizierte Bussys tern kann dabei 
bereits einem Indus tries tandard entsprechen, z. B. PCI, RapidIO, Pirewire, 

45 USB, Ethernet, RAMBUS, DDR-RAM etc. \m somit einen einfachen und 

unaufwendigen Anschluss der peripheren Cerate zu enn5glichen. Oegebenenfalls 
kOnnen auch in zwischengeschalteten lOAGs (vgl. DB 196 54 595.1-53 ) 

6 
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Protokollkonvertierungen derart durchgefUhrt werden, so dass ein internes 
vereinfacdites^.u^ eih bder meiirere 

komolexere exteme Standaxdprotokolle tibersetzt werden. 
Es soli besonders dairauf hlngewiesen werden, dass unter Peripherie auch 
5 Speicher verstanden werden, wie bei den bereits aufgez^hlten Busprotokollen 
\rerdeuklicht wird. 

£benfalls Ist er£indungsgen£US besonders relevant, dass PAEs auch mehrere 
. AnschlUsse an dedizlerte Bussysteme aufwelsen kdnnen. 

10 ; .... . 

Desweiteren sind anwendxingsabhangig auch Architekturen sinnvoll, bei denen 
nur eine Teilmenge der PABs AnschlUsse an ein dediziertes Bussystem aufweist, 
Oder unterschiedliche PAEs mit einer unterschiedlichen Anzahl von Anschlttssen 
an ggf. auch xinterschiedliche dedizierte Bussysteme aufweisen. 
■15- • ■ ■ 

Im folgenden wird eine detaillierte Beschreibung einer AusfClhrungsvariante 
der erfindungsgemafien Kopplimg von XPAB und RBAM ausgeffUirt; 

Es wird erfindungsgemafi bei einem in Punktion und/oder Vemetzung 

20 insbesondere zur Lauf zeit ohne StCruhg nicht zu rekon£ig\2rierender Blemente 
rekonf ig\irierbaren Zellelementefeld zur Datenverarbeitung niit Funktionszellen 
zur Ausftlhrung algebraischer und/oder logischer, konfigurierbarer Punktionen 
und Speicherzellen, urn Infonnationen zu eng^fangen, abzuspeichem und/oder 
auszugeben vorgeschlagen, daS eine Steuerverbindung (CHD) von den 

.25 Funktionszellen zu den Speicherzellen gefOhrt ist. Diese Steueirverbindung 

dient dazu, die Adress- und/oder Datenein/ausgabe aus dem Speicher durch die 
zugeordnete Pun3ctionszelle, typisch einer AL0-PAE, steuerbar zu znachen. So 
kann etwa angegeben werden, ob die n£Lchste tlbertragene Information als 
Adresse Oder als Daten behandelt werden soil und ob ein Lese- und/oder 

30 Schreibzugriff erf orderlich ist. Diese I>atent!lbertragung aus der 

Speicherzelle, bei der es sich etwa um eine RAM-PAB handeln kann, auf die 
ALU-PAE erlauben dann,. daS neue, von der ALU abzuarbeitende Befehle in diese 
geladen werden kOzmen. Es ist auf diese Weise mOglich, lediglich durch 
Vorsehen einer dedizierten und dediziert fimktionszallenkontrollierten 

35 Steuerverbindung zwischen Funktionszelle und Speicherzelle bereits mit nur 
zwei Elementen, die tkber geeignete Busse verbunden sind, eine 
Sequenzerstruktur in einem Zellelementefeld aufzubauen, ohne daS ansonsten 
weitere MaSnahmen und/oder bauliche Verdnderungen erf orderlich sind. In der 
Speicherzelle kdnnen Daten, Adressen, Progranmschritte usw. in per se aus 

40 herkemmlichen Prozessoren bekannter Weise abgelegt werden. Weil beide 

Blemente auch in anderer Weise bei entsprechender Konf igxiration einsetzbar 
sind, ergibt sich eine besonders effiziente Bauweise, die sowohl 
Sequenzerstrukturen als auch vektoriellen und/oder pa- rallellslerbaren 
Struktouren besonders gut anpaiSbar ist. 

45 

Es ist einsichtig, daS durch die Verwendung von lediglich zwei Zellen in 
einem Zellelementefeld, nStolich der Funktionszelle \uid der 

7 
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Informationsbereitstellungszelle eine Vielzahl von sequenzerartigen 
' Struktureri in diem relconf igurierbaren Zellelemehtef eld iaufgebaut werden kaxm. 
Dies ist insofem vorteilhaft, als oftmals bei der Datenverarbeitung, etwa in 
einem multitaskingfahigen Betriebs system, eine Reihe unterschiedlicher uhd 
5 voneinander per se yersqhiedener Aufgaben abgearbeitet werden mufi. Es kCnnen 
dann eine Vielzahl derartiger Aufgaben in einem einzlgen Zellelementefeld 
effektiv gleichzeitig abgearbeitet werden. Die Vorteile fttr 
Echtzeitanwendungen sind offensichtlich. Weiter ist es aucb mOglichr die 
einzelnen Sequenzerstrukturen, die in einem Zell- elementef eld unter 
. 10 . .Vorsehung der erf indungsgemaSen Steuerverbindung auf gebaut werden, mit 

unterschiedlichen Taktraten zu betreiben, etwa urn den Strosnrerbrauch dadurch 
zu senken, dafi Aufgaben mit geringerer Prioritat langsamer abgearbeitet 
werden/ Es ist tiberdies mOglich, bei der Ausftihrung per se weitgehend 
paralleler Algoritbmeh sequenzerartige Programmteile in dem Feld parallel 
IS Oder vektoriell abzuafbeiten luid urogekehrt. 

Deis Zellelementefeld mit den in Funktion und/oder Vemetzung konf igurierbaren 
Zellen kann einsichtigerweise einen Prozeesor, einen Ccprozessor und/oder 
einen Mikrocontroller bilden, bzw. eine parallele Vielzahl oder KonOsinationen 
20 derselben. 

Die Funktionszellen sind typisch als arithmetische Logikeinheiten gebildet, 
wobei sie insbesondere grobgranulare Blemente darstellen, die aber mit einer 
feingranularen Statemachine versehen sein kOxmen. In einem besonders 

25 bevorzugten AusffUirungsbeispiel handelt es sich bei den ALUs ina sogenaimte 
erweiterte ALDs (BALU), wie diese in den frtttieren Azuneldungen des 
vorliegenden Anmelders beschrieben wurden. Eine Brweiterung kann insbesondere 
die Steuerleltungskontrolle, Bef ehlsdekodiereinheit etc. umfassen, soweit 
erfordezriich. Es soil darauf hingewiesen werden, dass grundsStzlich zumindest 

30 eine Teilmenge der Funktionszellen auch aus feingranularen FPOA-Elementen 
aufgebaut sein kann. 

Die Speicherzelien kdnnen baten und/oder Inforroationen fllichtlg und/oder 
nichtflttchtig speichem. Wenn in den Speicherzelien abgelegte Informationen, 

35 seien es Programmschritte, Adressen ftir einen Zugriff auf Daten oder 

registerartig bzw. heap-artig abgelegte Daten als flOchtige Daten al^gelegt 
sind, so kann eine vollstftndige Rekonfiguration wShrend des Betriebes 
erfolgen. Altemativ ist es m&glich, nichtflUchtige Speicherzelien 
vorzusehen. Die nichtflQchtigen Speicherzelien kOnnen etwa als BB-Promr 

40 Bereich xmd dergleichen vorgesehen werden, in die ein rudimentares Bios- 

Programm abgelegt wird, das bei Inbetriebnahme der Anordnung auszuftihren ist. 
Auf diese Weise kann ohne weitere Bauteile eine Inbetriebnah m e einer 
Datenverarbeitungseinrichtung erfolgen. Ein nichtfltlchtiger Datenspeicher 
kann auch dann vorgesehen werden, wenn aus Kosten- und/der RatungrOnden 

45 Sseschlossen wird, da& immer wieder dieselben Programmteile auszufOhren sind, 
wobei dann auch unter eolchen festen Programmtetlen, etwa nach Art der WAVE- 
Rekonfiguration, im Betrieb gewechselt werden kann. Die M5glichkeiten, 
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derartige nichtflilchtige Speicher vorzusehen und zu verwenden, sind 
Gegenstcind anderer Schutzrechte des Aiuneiders. Es ist.mtJglichr sowohl. 
flUchtige als auch nicbtflUchtige Daten in den Speicherzellen abzuspelchem/ 
etwa um ein Blos-Prbgraniia £est abzulegen und die Spelcherzelie dennocb £t&r 
S andere Zwecke nutzen zu kdnnen • 

Die Speicherzelle ist bevorzugt so ausgebiXdet, daS sie eine Unreichende 
Vielzahl von zu verarbeitenden Daten und/oder abzuarbeitenden Programmteilen 
speichem kann . Es sei dabei darauf hingewiesen, daS diese Pxrograsimteile . 

10 . sowohl als Programnuschritte ausgebildet sein k6nnen, die jewjails vorgeben, . 
was eine einzelne, insbesondere die zugeordnete PAE, also insbesondere die 
die Speicherzelle steuemde Funktionszelle, im nSLchsten Schritt zu tun hat, 
als auch ganze Kdnfigurationeh fttr Feldbereiche oder andere Felder beinhalten 
kann. In einem solchen Fall ist es ohne wei teres mttglich, dafi die aufgebaute 

15 Sequenzerstruktur einen Befehl ausgibt, au£ Grund dessen eine Rekbnfiguration 
von Zellelementefeldbereichen erfolgt. Dandt eurbeitet die diese Konfigurataon 
auslGsende Funktionszelle dann zugleich als Ladelogik (CT) • Es sei darau£ 
hingewiesen, daS die Konfiguration von anderen Zellen wiederum dergestalt 
erfolgen kann, dafi dort eine sequenzerartige Datenverarbeitung erfolgt und es 

20 ist in diesen Feldem wiederum mOglich, andere Zellen im Verlauf der 

Programmarbeitimg zu konf igurieren bzw. rekonf igurieren . Dandt ergibt sich 
ein iteratives Konfigurieren von Zellelementebereichen und ein Einschachteln 
von Programmen mit Sequenzer- und Parallel-Strukturen, die ahnlich ineinander 
geschachtelt sind wie eine Babuschlca. Es sei darauf hingewiesen, dafi bier 

25 insbesondere durch Bin-Aasgabezellen ein Zugriff au£ weitere 

Zelleleznentefelder aufierhalb eines einzelnen integrierten Bausteines erfolgen 
kann, was die Gesamtrechenleistung nassiv erhahen kann. Es ist insbesondere 
inOglich, bei Auftreten von Konf igurationen in einem Codeteil einer in ein 
Zellelementefeld hiheinkonfigurierten Sequenzerstruktur gegebenehfalls 

30 entweder die Konf igxnrationsanf orderungen auf einem zugewiesenen 

Zellelementefeld, das von der jeweiligen Sequenzerstruktur allein verwaltet 
wird, durchzuftlhren \ixld/pder es k6nnen derartige Anforderungen an eine . 
Konf igurations -Has tereihheit aibgegeben wexrden, um sicherzustellen, dafi eine 
gleichmafiige Belegung aller Zellelexnentef elder erfolgt. Es ergibt sich somit 

35 quasi ein xmterprograimnaufruf durch Obergabe von erf order lichen 

Konf igurationen an Zellen oder Ladelogiken. Dies wird far sich als 
schutzwUrdig angesehen. Es sei auch darauf hingewiesen, dcifi die Zellen, 
sofem sie selbst ftlr die Konfiguration anderer zellelementfeldbereiche 
ZustSndigkeit besitzen, mit hard- oder softwareartig in^lementierten FIUSD- 

40 Strukturen und dergleichen zur Sicherstellung einer ordnungsgemaSen 

Rekonf iguration versehen sein kOnnen. Auf die £S5glichkeit, die Speicherzellen 
wahrend der Abzurbeitung von Befehlen derart zu beschreiben, dafi sich der 
abzuarbeitende Code bzw. das abzuarbeitende Programm &:idert, sei hingewiesen. 
In einer besonders bevorzugten Variante ist diese Art der Selbstmodifikation 

45 (SM) aber durch eine entsprechende Steuerung liber die Funktionszelle 
unterdrtlckt . 



9 
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Bs ist aOglich, dafi die Speicherzelle abgespeicherte Information hier auf die 
Aoeteuesnihg der sie steueradeh direkt oder indirekt auf einen 

zvr PuzOctionszelle ftlhrenden Bus gibt. Die indirekte Ausgabe kazm 
insiDesondere danh erfolgen, weim beide Zellen benachbsdrt liegen und die durch 

5 Ansteuerung angef orderte Xnf oxmation an die ALU-PAE tiber ein Bussegment 
eintref fen m\x&, das nicht unmittelbar mib dem Ausgang der Speicherzelle . 
verbunden werden kann. In einem solchen Fall Icann die Speicherzelle Daten auf 
dieses Bussystem insbesondere Ober Rtlclwartsregister (Baclcward-Register) 
ausgel>en. Es ist daher bevorzugt, weim zumindest eine von Speicherzelle 

10 . und/ Oder Funkt ions zelle ein seiches Baclcward-Register aufweist, welches im 
Infomationsweg zwischen Speicherzelle und Funktionszelle angeordnet werden 
kann. Diese Register brauchen in einem solchen Fall nicht zwingend mit 
weiteren Funktionalitaten versehen sein, obwohl dies etwa bei Anforderung von 
Daten aus der ^eicherzelle fOr die veitere Verarbeitung, entsprechend einem . 

15 herkOmmlichen LOAD-Befehl eines typlschen Mikroprozessors, z\ir Vertoderung 
der Daten noch vor dem Hineiziladen in die PAB ohne wei teres denkbar ist, urn 
z. B. einen Befehl IiOAD-f+ zu realisieren. 

Hit anderen Worten werden innerhalb der beschrlebenen Struktur 
Busverbindungen bei Bedarf durch die in der XPP-Technologie des Amnelders 

20 typischeh Forward ( FREG ) - vnd Backward (BREO) -Register geftlhrt, Diese besitzen 
die MSglichkeit Daten zwischen horizontalen Bussystemen vertikal zu 
tjbertragen und k(}nnen mehrere Busse multiplexen oder demultxplexen. Der 
Vollstandigkeit halber sein darauf hingewiesen, dass FREO und BREG (entgegen 
Ihrer Namensgebung) nicht zwangsiauf ig Regis terstuf en darstellen, sondem 

25 lediglich optional und ggf . konfigurierbare Register aufweisen. 

Die Steuerverbindwg (CMD) kann dabei an FREG md/oder BREO der jeweiligen 
Funktionszellen (PAEs) geftlhrt werden, urn die Busdatentransfers entsprechend 
des aktuell ausgefOhrten Befehls zu steuem. 

30 . Die Speicherzelle wird bevorzugt dazu angeordnet sein, Inf ormationen von der 
sie steuemden Piinktions zelle zu excipfangen, wobei auch weiter ein 
Jnformationseinspeichem Cber eine Ein- Ausgabezelle und/oder eine die 
Speicherzelle nicht steuemde Zelle mfiglich ist. Insbesondere danh, wenn 
Daten von einer Ein-Ausgabezelle in die Speicherzelle geschrieben werden 

35 sollen, ist es bevorzugt, wenn auch diese Ein*Ausgabezelle (I/O-PAE) von der 
Fuhktionszelle gesteuert wird. Dabei kann etwa die Adresse, bei welcher eine 
in die Speicherzelle zu schreibende oder gegebenenfalls auch direkt an die 
Funktionszelle (PAE) zu ttbertragende Information zu lesen ist, an die I/O-PAB 
von der AZiU-PAB llbermittelt werden. Es sei in diesem Zusammenhang darauf 

40 hingewiesen, daS diese Adresse iXb^ eine Adrefitibersetzimgstabelle 

(Adresstranalationtable), .einen Adresstranslationbuf fer oder eine MMO-artige 
Struktur in der I/O-PAE festgelegt werden kann. Es ergeben sich insbesondere 
in einem solchen Fall die vollen Funktionalitaten typischer Mikroprozessoren. 



45 Die Funktionszellen-Speicherzellenkombination ist demnach in einer 

bevorzugten Variante zumindest ein Bin-Ausgabe-Mittel zugeordnet, mit welchem 
daim an eine exteme Einheit, eine andere Funktionszelle, Funktionszellen- 

10 
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Speicherzellen-Kom~binatlon unci /Oder Speicherzellen Information gesandt 
iind/ Oder von dieiBer eit^fcmgeh werden kann, . 

Die Bin-Ausgabe-Einheit wlrd dcD^ei bevorzugt gleichf alls , zum 
S Steuerbefehlen aus der Punktionszelle axisgeblldet. 

Die Funktionszellen-Speicherzellenkombination weist bevorzixgt 
DatentransfexmOglichkeiten an die Ubrigen Funktionszellen und/oder 
Speicherzellen eines VPU-Bausteines auf , insbesondere solchen, die sich im 
10 Array aus PAEs (PA) befinden. Hierzu werden Zugrif f smSglicbkeiten Qber die 
Bussysteme au£ die entsprechenden Zellen zur Verfilgung gestellt. Der Zugriff 
erfolgt bevorzugt Clber die Forward- und/oder Backward-Register, der PAEs der 
Funkti onsz el 1 en-Spei cherzellenkombination^ durch die Obertragiong der " Port - 
Steuerkoxnmandos . 

15 

In einer bevorzugten Variante ist die Steuerverbindung (CMD) dazu 
ausgebildet, ziamindest einige und bevbrzugt alle der nachfolgenden 
Steuerkianmandos zu (tbertragen: 

20 

OPCODE FETCH, 

INTERNE/EXTERNE DATENZUGRIPFE, 

POSXTXOKIERinaO VON XmmNm/KSSWXm ADRESSPOINTERNr 
P0SITX0NIERUN8 VON INTEBNEN/EXTERNEN PROORAHHPOXNTERN, 
25 PROGRAMMPOINTER INCREMENT, 

P0SITI0NXERUN6 VON INTERX3EN/EXTERNEN STACKPOXNTBRN, 
SVACKZUGRIFFB (PUSH ^ POP) 

Beispielsweise kann dieise FunktionalitSt durch folgende CMD Steuerkonmiandos 
30 ixnplementiert werden: . 

load^const: Lade eine Konstante in ein Register 

write.Jlap: Setze Adress Pointer £ttr Speicherzugriffe 

(z. B. Heap) 

readwJ^P: Lese Adress Pointer £0r Speicherzugriffe 

35 (z. B. Heap) 

reacLj^: Lese ein Register aus dem Speicher (wenn Register in (£ler 

RAH-PAE impl ementi er t sind) 
write^Reg: Schreibe Daten in ein Register im Speicher (wenn Register 

in der RAM-PAB inplementiert sind) 
40 write&decr JElsp : Schreibe ein Datenwort auf den Stack und dekrementiert 

den Stackpointer 

read&incr..J^: Lese ein Datenwort vom Stack und inkrementeiere den 

Stackpointer 
set..^p: Setze Programnpointer 

45 setfipusKj^: Schreibe Programnipointer auf Stack und setze 

Prograznnpointer neu 



11 
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Die Steuerkommandos dienen der Steuerung der angeschlossenen SpeicherzeXXen 
• / und FunktioiiszeXXen (PAEs) . Weiterhin steuern die . Steuerkoxmtandbs den 
Datentremsfer auf den Bussystemen, beispieXswelse durch Ansteuerung von 
MuXtipXexem, Switches, Transmission Gates, 6. a. in den Foicward- uhd . 
5 Backward-Registem (FRBQ/BRBG) . Weitere BefehXe sind z. B.; 

rea(^Fortt iiese Daten von einem Port (beispieXsveise implementiert 

durch ein FRE3G) zum Array 
writeJE>ort: Schreibe Daten auf einen Port (beispieXsweise 

impXementiert durch ein BREG) zum Array 

10 

Dies kann durch eine entsprechende Bitbreite der SteuerXeitung und eine 
zugeordnete Decodierung bei den Bnpfangem erfoXgen. Die jewelXs 
erforderXichen Steuer- und DekodiermitteX k5nnen probXemfrei und 
kostengtinstig vorgesehen werden. Wie ersichtXich, ergibt sich mit den 
15 SignaXen eine praktisch voXXst&ndige Sequenzerfahigkeit der Anordnung. DaS 
auf diese Weise eine AXXgemeinzwecJqprozessordatenverarbeitungseinheit 
erhaXten wird, sei erwShnt. 

Die Anordnung wird typisch so gewShXt sein, dafi die FunktionszeXXe aXs 
20 aXXeiniger Master auf die Steuerverbizidung und/oder ein aXs Steuerverbindung 
dienendes Bussegxnent bzw. Bussystem zugreifen kann. Es ergibt sich somit eine 
Anordnung, bei der die Steuer Xeit\ing aXs Coniniand*-Iieltung wirkt, wie sie in 
herkdnooXichen Prozessoren vorgesehen 1st. 

25 Die FunktionszeXXe und die SpeicherzeXXe bzw. I/O-ZeXXe sind bevorzugt 

benachbart angeordnet. Uater benachbart kann dabei wie bevorzugt verstanden 
warden, daB die ZeXXen unmitteXbar nebeneinander angeordnet sind. AXtemativ 
befinden sie sich zumindest dicht beieinander. Die Anordnung der Funktions- 
und SpeicherzeXXen in Nachbarschaf t zueinahder sorgt dafOr, daE keine, 

30 jedenf aXXs keine signif ikanten Ziatenzzeiten zwisdhen Ansteuerung und . 

Dateneingang der angef orderten Information in der FunktionszeXXe auf treten, 
nur weiX die Verbindungen zwlschen den ZeXXen zu Xang sind. Dies sei aXs 
^direkt'' verstanden. MOssen Latenzzeiten bertlcksichtigt werden, so kann auch 
ein Pipelining in den Sequenzerstrukturen vorgesehen werden. Dies wird 

35 besonders wichtig bei sehr hoch getakteten Anordnungen. Es sei darauf 

hingewiesen, dafi es ohne wel teres sidgXich ist* entsprechend hochfreguent 
getaktete ZeXXeinheiten vorzusehen, die wie im Stand der Technik per se 
belcannt, auch entsprechend schneXX auf geeignete SpeicherzeXXen zugreifen 
k^nnen. Auch in einem soXchen Fall, etwa wenn per se bekannte 

40 ArchitektureXemente ftir die FunktionszeXXen verwendet wearden, wird 

gXeichzeltig eine Rekonf igurierbarkeit des FunktionszeXXeneXementes und der 
zugehdrigen Vemetzungen vorzusehen seln. In einer besonders bevorzugten 
Variante sind die FunktionszeXXen, die XnfonoationsbereitsteXXwgszeXXen wie 
SpeicherzeXXen, I/O-ZeXXen und dergXeichen ntuXtidimensionaX angeordnet, 

45 insbesondere nach Art einer Matrix bzw. auf Gltterpunkten eines 

eindimensionaXen Gitters usw. Wenn eine regeXmASige Struktur vorXiegt, wie 
dies dort der FaXX ist, wird einer ZeXXe typisch aus einer ersten Relhe 
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Information, das heifit Operanden, Konf igurationen. Trigger signale usw. 
zuge£tkhrt> w^Qirend jji einer da]^ Daten^ Triggersignale tmd 

andere In£onnatiohen abgegelden werden. in einem solchen Fall wird es 
bevbrzugt sein, wenh die ZeXlen in ein und derselben Reihe liegeh md es kann. 
5 dann der Infonoationstranefer aus der inforxoationsbereitstellungszeXle in den 
erforderlichen Eingang der Funktionszelle tOber ein Beuikn^ard-Register 
erfolgen. Die H5glichkeit, die Register fiXx Pipelining zu benutzen, sei 
erwabnt. 

10 Es Wird weiter Schutz beansprucht tiXr ein Verfahren zisa Betrieb eines 

ZelXelementef eldes , insbesondere nniltidixaensionalen Zellelemehtefeldes mit 
Funktionszellen zur AusfUhmng algefaraischer und/oder logischer Funktionen 
und Informationsbereitstellxingszellen, insbesondere Speicherzellen und/oder 
...Bin-Auisgabezellen zun Eopfangen und/oder Ausgeben von Informationen xmd/oder 

15 Speichem derselben, wobei' zumihdest eine der Funktiohszellen Ste\ierbe£6hle 
an zumindest eine XnformationsbereitBtellungszelXe ausgibt, dort im 
Ansprechen au£ die Steuerbefehle Information £ttr die Funktionszelle 
bereitgestellt wird tmd die Funktionszelle dazu ausgebildet ist, die weitere 
Datenverarbeitung im Ansprechen au£ die bereitgestellte Information 

20 durchzufOhren, um so sequenzerartig Da ten zu verarbeiten. 

Es wird also in einem rekonfigurierbaren Feld durch die Ausgabe der 
Steuerbefehle an die Speicherzelle einer Sequenzerstruktur eine 
sequenzerartige Datenverarbeitung ezmdglicht. Die Befehle, die als 
25 Steuerbefehle von der Funktionszelle ausgegeben werden k6nnen, ermOgllchen 
dabei einen seguenzerartigen Betrieb, wie er aus herkOmmlichen Prozessoren 
bekannt ist. Es sei darau£ hingewiesen, daS es ohne weiteres mSglich ist, nur 
Teile der genazinten Befehle zu ixnplementieren tmd dennoch ^ine vollstSndig 
sequenzerartige Datenverarbeitung zu gew^hrleisten. 

30 

Die vorstehende AusfOhrungsvariante wird im folgenden noch einmal und 
beispielsweise an^tand der Zeichnungen beschrieben. Xn .dieser ist gezeigt. 
'■ -durch:' 



Fig. 


1 


ein erfindungsgemaSes Zellelementefeld, 


Fig. 


2a 


ein Detail biervon. 


Fig. 


2b, c 


das Detail von Fig. 2a w£lhrend verschiedener 






Datenverarbei tungs z ei ten , 


Fig. 


3a 


eine alternative Ausftlhrungsform des Details 






von Fig. 2, 


Fig. 


3b 


eine besonders bevorzugte Variante des 






Details. 


Fig. 


4 


Grundaufbau einer Punktions-/ Speicherzelle 






(PAE) 


Fig. 


5 


eine Ausgestaltungsveuriante von Fig. 3b 
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Nach Fig. l(a/b) uiofaSt ein allgemein mit 0101 bezelchnetes Zellelementefeld 
zur Datenverarbeitung OlOl. Punktionszellen 0102 ztir /oifsftlhrurig voiii , 
arlthinetischen und/oder logiscben Fiinktlonen sovie Speicherzellen 0103, urn 
Infozmationen zui en^£angen, abzuBpeiche^ und/oder auszugeben; wobei eine 
5 Steuexrverbindung 0104 von Funktlonszellen 0102 zu den Speicherzellen 0103 
geftthrt 1st. 

ZunSchst wlrd die Arbeitsweise von Fig. la besclirieben. Fig. lb stellt eine 
bevorzugte Ausgestaltung und Anordimg der Funktlonszellen und Speicherzellen 
10 dar. 

Das Zellelementefeld 0101 ist in der Vemetzung der Elemente 0102, 0103, 0104 
frei konfigurierbar, xmA zwar ohne den laufenden Betrieb nicht neu zu 
konfigurierender Zelielementeteile zu stOren. Dabei kdnnen die Verbindungen 
konfiguriert werden, indem Bussysteme 0105 wie. erforderlich geschaltet 

15 werden. Welter isihd die Funktidnszellen 0102 in ihrer jeweiligen Funktion 
konfigurierbar. Bel den Funktlonszellen handelt es sich um arithmetische 
Logikeinheiten, die ^m bestinmte, Rekonfiguration enodglichende Schaltkreise 
erweitert sind, wie Statexnachines , Schnittstellenbeschaltung zur 
Komraunikation zuit der bevorzugt auEerhalb des Zellelementefeldes angeordneten 

20 Ladelogik 0106 usw. Auf die entsprechenden Voranmeldungen des Amaelders wird 
hingewieeen. 

Die Zellelemente 0102, 0103 des Zellelementefeldes 1 sind zveidimensional In 
Reihen und Spalten angeordnet, wobei jeweils eine Sfpeicherzelle 0103 

25 immittelbar neben einer Funktionszelle 0102 liegt \ind hier je Relhe drei 

SpeiGherzellen-Funktionszellen-Paaire vorliegen, in denen die Funkt ions- und 
Speicherzellen jeweils iXber Steuerverbindungen 0104 niteinander vertyunden 
sind. Die Funktions- und Speicherzellen 0102, 0103 weisen Kingange auf, die 
mit dem Bussystem oberhalb der Reibe, in der sich die jeweiligen Zellelemente 

30 verbindbar sind, um Daten davon zu empfangen. Weiter weisen die Zellen 0102, 
0103 Ausg^nge auf, die auf das Bussystem 0105 unterhalb der Reihe Daten 
ausgeben. Wie noch eriautert werden wird, ist Oberdies jede SEfeicherzelle 
0103 mit einem Rdckwkrtsregister (BW) versehen, durch welches Daten von dem 
Bus unterhalb einer Reihe auf den Bus oberhalb der jeweiligen Reihe 

35 durchgeschleust werden kdimen. 

Mit Ausnahme der Steuerverbindungen 0104 xmd der zugeordneten Schaltiuigen 
innerhalb der Funktlonszellen (ALU in Fig. 2) bzw. Speicherzellen (RAM in 
Fig. .2) handelt es sich bei dem Zellelementefeld zur Datenverarbeitung von 

40 Fig. 1 xim ein herkfiinmliches Zellelementefeld, wie es bei rekonflgxirierbaren 
Datenverarbeitunsanordnungen, bei spiel sweise einer VFU entsprechend der XPP- 
Technologie des Anmelders gebrduchlich und bekannt ist. Insbesondere kann das 
Zellelementefeld von Fig. 1 wie bekannt betrieben werden, weist also 
entsprechende Beschaltungen zur Wave-Rekonfiguration, zum Debugging r 

45 Obertragen von Triggersignalen etc. auf. 
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Die Besonderhelten des Zellelementefeldes der vorliegenden Erfindung ergeben 
' sich aus der Steuerverbindung 0104 und der zugehoflgen BesclUilttmg; die 
nachfolgend ncUier beschrieben werden vird mib Bezug auf die Fig. 2a-c. Ea sei 
dabei exni/^hnt, daE, wSUirend in Fig. 1 eliie Steuervierbindung 0104 stets von 

5 elnem weiter links liegende Funktionszellenelement zu einer welter rechts 
liegenden Speicherzelle gefOhrt ist, und zwar nur und genau zu einer solchen 
Speicherzelle, es einleuchtenderweise mOglich ist, auch £(lr die 
Steuerleitungen eine Iconfigurierbare Vemetzung vorzusehen, lua entweder an 
anderer S telle liegende Spelcherzellen anzusprechen und/oder van gg£. mehr als 

10. eine . Speicherzelle ansprechen zu kOnnen, wenn etwa in groSeia Umfange . .. 
Speicherbedarf fUr Informationen besteht, die von den Speicherzellen zu 
enipfangen, abzuspeicbexn und/oder auszugeben ist» Aus GrOnden der 
tJbersichtlichkeit wird aber in Fig, 1 und 2 lediglidh au£ fest vorgesehene 
einzelne Steuerverbindimgen Bezug genommen, was das Verstandnis der Brfindung 

15 wesentlich erleichtert . Die Steuerverbindung ist im tlbrigen 

erforderlichenfalls durch herkfixmoliche Leitungen, entsprechende Protokolle 
yorausgesetzt, substituierbar. 

In Fig. 2 1st die Funktlonszelle 0102 als ALU und die Funktionszelle 0103 als 
20 RAM bezeichnet. Oberhalb der Reihe, in der die Zellen liegen, verl&uft der 

Bus 0105a, der das bereits erwShnte Backw£urd-Register 0103a mit den EingSngen 
0103b der Speicherzelle und 0102b der ALU verbindet- Das unterhalb der Reihe 
verlaufende Bussystem ist nit 0105b bezeichnet und es sind von dem Bussystem 
0105a, 0105b xiox die relevanten SegiDente gezeicbnet. Es ist erkennbar, daS 
25 . das Bussystem 0105b altemativ Da ten erhait aus einem Ausgang 0102c der ALU 
0102, einem Ausgang 0103c des RAM 0103 und dafi es Daten in den Bingang 0103al 
des Backward-Registers ftthrt. 



Die ALU 0102 weist zugleich weitere Bin- und AusgSnge 0102al, 0102a2 auf, die 
30 auf andere Bussegmente geschaltet sein kCnnen tind Ober welcshe die ALU Daten 
wie Operanden enpfSngt bzw. Brgebnisse ausgibt. 

Die Steuerverbindung 0104 befindet sich dauerhaf t uniter der Kontrolle der 
eirweiterten Schaltkreise der ALU und stellt hier eine Verbindmg dar, tiber 

35 welche eine Vielzahl von Bits Obertragen werden kann. Die Breite der 
Steuerverbindimg 0104 ist dabei so gewSlhlt, dafi zumindest die zuvor 
beschreibenen Steuerbef ehle an die Speicherzelle und die Forward/ Backwsuxl- 
Register (FRBG/BREG) tlbertragen werden kdnnen. Die Speicherzelle 0103 weist 
zugleich bevorzugt drei Speicherbereiche auf, namlich einen sog. Stack- 

40 Bereich, einen Heap-Bereich und einen Prograinm-Bereich. Jedem Bereich ist 
dabei ein eigener Zeiger zugeordnet, tlber den bestixnmt ist, auf welchen 
Bereich des Stacks, des Heaps und des Progranmbereiches jeweils lesend oder 
schreibend zugegriffen wird. 



45 Der Bus 0105a wird im Zeitmultiplex gemeinsam von den Einheiten 0102 und 0103 
verwendet. Dies ist in den Fig. 2b, 2c angedeutet. So ist in. Fig. 2b eine 
Situation gezeigt, in welcher aus dem Ausgang 0102a2 der ALU~PAB Daten tiber 
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das Backward-Register auf den Eingang der RAM-Zelle gesandt werden kttnnen, 
wohingegexi der. 2eitglej,ch besteheride^V wei^ nidht benutzten Verbindung 

zwischen dem Ausgang 0103c des RAM zum Bus 0105b und der Verbindung zwischen 
dem Ausgang des Backward-Registers BW z\m Eingang 0102 b d^ ALU-PAE zum 
5 Zeitpunkt von Fig. 2b keine Bedeutung zukonimt, wesbalb diese gesbrichelt 
angedeutet sind. In Fig. 2c ist bingegen ein Zeitpunkt gezeigt, zu welchexn 
die Speicherzelle 0103 Ober ihren Ausgang 0103c aus dem tlber Steuerleitung 
0104 bestinmten Speicherbereich Stack (0203), Heap (0202), Program (0201) die 
Information tlber das Backward-Register an den Eingang 2b der ALU-PAB 0102 
10 speist, wcLhrend der Ausgauig der ALU-PAE 0102c inaktiy ist und am Eingang 
0103b der RAM-PAE kein Signal empfangen wird. Aus diesem Grund sind die 
entsprechenden Verbindungen strichpunktiert und somit bXb inaktiv 
dargestellt. 

15 innerhalb der RAM-Zelle 0103 ist eihe Schaltuxlg bl03d vorgesehen, in der die 
itt>er die Steuerleitung 0104 bzw. das Steuerleitungsbus segment 0104 enpfangene 
Information decodiert wird. 

Die AusfOhrungsvariante der Erfindung wird verwendet wie folgt: 

20 

Zunachst empf&cigt die ALU 0102 Konfigurationsinformation von einer zentralen 
Ladeloglk, wie im Stand der Technik bereits bekannt. Die 

InformationsObertragung kann in per se bekannter Weise unter Verwendung des 
RDY/AOK-Protokolls und dergleichen geschehen. Auf die M5glichkeit, bei der 
25 Ladelogik elnen FlliMO-Speicher usw, vorzusehen, urn eine ordntrngsgexnASe 
Konfiguration der Anordnung zu ennfigllchen, wird hingewiesen. 

Mit den Daten f Or die Konfiguration der ALU 0102 wird zugleich eine Reibe von 
Daten aus der Ladelogik Obertragen; die ein seguenzerartig abzuarbeitendes 

30 Prograxoa darstellt. Dieses Progxaxnm kann entweder bereits das zur Berechnung 
bzw. AuBfObirung der Application aus zuftthrende Prograinm sein, oder einen CS 
Urlader (Boot) darstellen> der erst das aus zufOhrende Applikationsprogramm 
von einer extemen isinheit (Speicher, Peripherie) ladt. Das Laden des 
Programmes kann en tf alien, wenn ein Teil des der ALU zugeordneten Speichers 

35 nichtflflchtig (z. B. ROM, EPROM, EBPROM, Flash-ROM) ausgestaltet ist und ein 
Urlader oder das Applilcationsprogramm dort fest gespeichert ist. Dies kann 
insbesondere dann von Vorteil sein, wenn die Applikation vorab bekannt ist 
und unabanderlich gestaltet werden kann, da eine feste Inplementierung dann 
zu einer erheblichen Kostenredxiktion fOhren kann. Die ALU gibt deshalb 

40 wahrend ihrer Konfiguration auf der Leitung 0104 einen entsprechenden Befehl 
aus, der den Programmzeiger zum Schreiben auf einen vorgegebenen Wert 
innerhalb des RAM setzt. Danach werden von der iiadelogik bei der ALU 
eapfangene Daten Ober den Ausgang 0102c Ober den B\is OlOSbl und das Baclcwaard- 
Register 0103a gespeist und gelangen von dort in den Eingang 0103b der RAM- 

45 PAB 0103. Von der Einheit 0103d werden entsprechend des Steuerbefehls auf 
Steuerleitung 0104 dann Daten auf den angewiesenen Programmspeicherplatz 
geschrieben. Dies wiederholt sich, bis samtliche, von der Ladelogik bei der 
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Konf ig\iration en^f angenen Prograxnmteile in der Spelcherzelle 0103 abgeXegt 
sind. Wenn dann die konfiguration der ALU beendet ist^ diese diirch 

Ausgabe der entsprechenden Befehle au£ der Steuerleitung 0104 die n&chsten, 
von ihr sequenzerartig abzuarbeitenden Programmschritte £Uif ordeni vmd ^Xber 
5 den Ausgang 0103c, den Bus 0105b, das Backward-Register der RAM-PAE 0103 und 
den Bus 0105a an ihreia Eingang en^fangen. wahrend der Frogrammabarbeitimg 
k5nnen dabei Situationen auf treten, bei denen SprOnge innerhalb des 
Programmspeicherbereiches erforderlich sind, Daten in die ALU-PAE aus der 
RAM-PAE geladen werden, Daten im Stack abgelegt werden xnttssen usw. Die 

10 diesbezUglicbe Kommunikation zwischen. AIAJ^PAE \md RAM-PAB erfolgt liber die. 
Steuerleitung 0104, so dafi die AI»U-PAE zu jedem Zeitpunkt die Dekodierung 
durchfOhren }cann. Oberdies k6nnen auch, wie bei einem herkdinmlichen 
Hilcroprozessor^ Daten aus einem Stack oder einem anderen RAM-Speicherbereicb 
enqpfangen werden und es kCnnen C33erdies Daten von aufierbalb als Opeiranden in 

15 der ALU-PAE eiqpfangen werden. 

Es f indet dabei die Abarbeitung der Prograxnmseguenz statt, die in den RAM-PAE 
dvirch die Ladelogik vorkonf iguriert wurde. In der AI*D-PAE wird dabei 
ztigleich, wie per se erforderlich, eine Befehlsdekodierung vorgenonmen. Dies 
20 geschieht mit den per se gleichen Schaltkreisen, die schon tiXr die 

Dekodierung der von der Ladelogik erhaltenen Befehle verwendet werden. 

Es wird Ober die AI^tT zu jedem Zeitpunkt die Steuerleitung 0104 kontrolliert, 
so 6a& die RAM-Zelle stets genau die Art des Spelcherzugrif fes befolgt, die 
25 von der ALU vorgegeben ist. Au£ diese Weise ist sichergestellt, daS 

ungeachtet der Zeitmultiplex-Benutzung der Buselemente OlOSa, b jederzeit den 
in der Sequenzerstruktur vorhandenen Blementen vorgegeben ist, ob auf den 
jsussen Adressen ftir zu holende \ind/oder zu schreil>ende Daten oder Codes 
liegen oder ob und gegebenenfalls wohin Daten zu schreiben sind etc. 

30 

Die in Bezug auf Fig. 2 gezeigte Anordnung Icann auf iinterscbiedliche Arten 
erweitert oder yerSndert werden. Besonders relevsoit sind die in Fig* 3a und 
3b dargestellten Varianten. 

35 Nach Fig. 3a ist zur Verlaindung von oberen und unteren Bussen nicht nur ein 
Backward-Register an der RAM-PAE vorgesehen, sondem es sind auch ein 
Vorwarts -Register an der RAM-PAE und Vorwarts- und Rttckwarts-Register an der 
ALU-PAE vorhanden. Diese kfinnen, wie durch die Mehrfach-Pfeile angedeutet, 
dazu dienen, von anderen Einheiten, wie extemen Hosts, extemen Peripherie- 

40 Geraten wie Festplatten, Hauptspeicher \md dergleichen und/oder von anderen 
Se(xuenzerstrukturen, PAEs, RAM-PAEs etc. Daten zu eirpfangen und an diese zu 
senden. Wenn ein entsprechender Anforderungsbefehl far neue Programmteile aus 
der Sequenzerstruktur, die durch die ALU-PAE vnd die RAM-PAE gebildet ist, 
abgesandt wird, ist es mOglich, ProgrammblOcke in der Sequenzerstruktur 

45 abzuarbelten, die weit gr6Eer sind als jene, die in der RAM-PAE speicherbar 
sind. Dies ist insbesondere bei konplexen Datenverarbeitungsaufgaben, 
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Sprttngen iXbex weite Bereiche, Insbesondere in Unterprogramme U6W. von 
massivem Vorteil. ' ' ' '.' 

Eihe iioch welter bevorzugte Variante ist in Fig. 3b gezeigt. Hier 
5 komnniniziert die wa-PAB nicht nur nit einer RAH-PAB, sondem zugleich mit 
einer Znput/Output-PAB, die dazu auegebildet ist, eine 

Schnittstellenbesclialtung ftlr die Koxnmunikation mit extern en Bauelementen 
vorztisehen, wie Festplattea, anderen XPP-VFUs, fremden Prozessoren xmd 
Coprozessoren usw. Wiederum ist die ALU-PAE die Einheit, die als Master fOr 
10 die als «CMD^ bezeichnete Steuerverbindimg arbeitet und wiederiim werden die 
Busse in Multiplex-Weise verwendet. Auch hier kann eine Dbertragung von Da ten 
von dem Bus unterhalb der Reihe in den Bus oberhalb der Reihe durch das 
Baclcward-Register erfolgen. 

15 Die in Fig* 3b gezeigte Anordntmg ezmOglicht es, exterxie Zugrlffe au£ nicht 
in der SpeicherzelXe RAM-PAE abspeicherbare Inforroationen besonders leicht zu 
gestalten und ermOgXicht daxnit eine Anpassung der Sequenzerstruktur an 
bestehende, herkamxnliche CPa-Tecbnologien und deren Betriebsverfahren in noch 
starkerem MaBe insoweit, als nun in der Eingabe-Ausgabezelle 

20 .Adresstibersetzungsmlttel, Speichexverwaltungseinheiten (MUU-Funktionen) und 
dergleichen isnpleznentiert sein kOnnen. Die RAH-PAE kann hier etwa als Cache, 
insbesondere aber als vorgeladener Cache dienen. 

Es sei darauf hingewiesen, dafi nehrere Seguenzerstrukturen gleichzeitig in 
25 ein und dasselbe Feld hineinkonfiguriert werden k&nnen, dafi Funktionszellen, 
^eicherzellen und ggf * Ein-AusgabezelXen wahlweise fOr Sequenzerstrukturen 
und/oder eine fOr die XPP-Tecfanologie herkOmmliche Weise konf iguriert werden 
kOnnen und daE es ohne wei teres m5glich ist, da& eine ALU an eine andere AIiU 
. Daten ausgibt, die diese in einer Sequenzer-Weise konf igurieren tmd/oder zum 
30 Teil eines Zellelmentefeldes nachen, mit dem eine bestimmte Konfiguration 
abgearbeitet wird. Auf diese Weise wiard dann geg^benenfalls auch die. 
. Xiadelogik entbehrlich. 

Figur 4 zeigt nun noch einmal detailliert den Grundaufbau einer PAE. Der Kern 
35 einer PAE, typischerweise bestehend aus einer oder mehreren ALUs und/oder 
einem $peicher und/oder FPGA-Elementen erhAlt Daten von dem Bussystem 0105a 
und tibertrSgt die Ergebnisse der Datenvercurbeitung an das Bussystem 0105b. 
Nelsen dem Kern sind die Forward-Register (FRB6, 0402) \md Backward-Register 
(BREO, .0403) angeordnet und tibertragen Daten von 0105a nach 0105b (FRBG) bzw. 
40 von 0105b nach 0105a (BREO) .BREO und FREO kOnnen ebehfalls eine oder mehrere 
ALUs \and/oder einem Speicher und/oder FPGA-Blementen enthalten. Bevorzugt 
sind diese jedoch in ihrea Funktionsumfang gegentSber dem Kern (0401) 
eingeschr^nkt . 

Die Bussysteme 0105a und 0105b sind bevorzugt jeweils in ein Bussystem zur 
45 Obertragung von Daten (DATA) und ein Bussystem zur Obertragung von Trigger, 
also Statussignalen (TRIGGER) unterteilt. 
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Die Konf iguration der PAE erf olgt durch eine tibergeordnete 
Konfigurationseinheit (z. B, eliie CT) / die tlber eiaen Konfiguratioiisiaus 
(0404) Konfigurationsworte an die PAB fibertragt. Diese werden in 
Kohfigurationsregistern gespeichert (0405) . Optional 
5 Konfig\irationsstaclc (0406) nach PACT17 und wie nachfoigend beschrieben 

zvischen den Konfigurationsbus (0404) und die Konfigurationsregister (0405) 
zwischengeschaltet sein. 

Der Konf ignrationsstack kann Daten und/oder tevorzugt Trigger von den 
Bussystemen 0105 (a/b) exnpfangen xxnd an. diese senden. 

10 .. . ' . 

Die PAE Icann optional einen AnechluS an ein dediziertes Bussystem (10- 
Channelr 0407) aufweisen. Zur Steuerung des Bussystems ist dem Kern (0401) 
eine zusatzlich^ Bussteuereinheit (0408) zugeschaltet. Ober den lO-Channel 
kan die PAE direkt mit einem globalen, ggf . auch extemen Speicher imd/oder 

15 Peripherie und/oder anderen PAEs Daten Obertragen. 

In einer bevorzugten Ausgestaltting besteht die Mdglicbkeit Konstanten ftir die 
Datenverarbeitung tSber 0404 zu setzen. In einer weiteren Ausgestaltung kann 
eine Konfigurationseinheit (z. B. CT) Daten aus den Arbeitsregistem 
20 auslesen, 

Figur 4 kann auch eine ^tsprechende RAK-PAK deirstellen. Ober 0404 kann dazm 
von einer CT die Vemetzung und Funktion des RAMs eingestellt vescden. 
Die Puoktion umfaSt beispielswiese folgende Funktionen oder Koznbinatianen 
25 daratus: 

1. Random Access 

2. FIFO 

3. Stack 
30 4. Cache 

5, Page Memory fClr MMUs 

Desweiteren kann in einer bevorzugten AusflShrung der Speicher mit Daten von 
der CT vorgeladen werden (z. B, konsteuiten, 
35 Lbokup-Tabellen, etc.), Ebenfalls kann die CT in einer erweiterten AusfOhrung 
Daten (z, B, zum Debuggen oder ftir Teuskwechsel) aus dem Speicher tJber 0404 
zurdcklesen. 

In einer bevorzugten AusftXhrung kann eine RAM-PAE mehrere AnschlUsse an das 
Bussystem 0105 aufwei sen (dual -port oder multi-port), wodurch mehrere 
40 Datentransfers gleichzeitig durchgefdhrt werden kOnnen. 

In einer weiteren Ausftlhrung kann die RAM-PAE einen dedizierten Anschlufi an 
einen extemen Bus aufweisen. 

RAM-PAEb kttnnen derart zusammengeschaltet werden, dass aus mehreren (n) RAM- 
PASS ein n-£ach grOfierer Speicher entsteht. 

45 
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Figur 5 zelgt eine Ausgestaltungsvariante des Sequenzers nach Pigur 3b ^ Die 
ALU-PAE weist eiheh Animal en RegistersatzRa, Rb, Rx auf/der In diesem 
Beisplel ledigllch zur Pufferung der Operanden uttd Ergebnisse dient. Der 
elgentXiciie Reglstersatz llegt:in der. RAM-PAB (Rd..Rn). Sbenfalls Ixinerhalb 
5 der RAM-PAB liegen die Register 
Rpp: Prograinm Pointer 

Rap: Adress Pointer fOr Datenzugriffe (z.B. Heap) 
Rsp: Stack Pointer fflr Stackzugrif fe 
Rfp: Frame Pointer zur Sicherung des Stack Pointers . 
10 bei TAiterprogrannDaufrufen , ... 

Der CMD-Bus wird von der ALU-PAB gesteuert und tlbertragt die 
Ablaufinfomation des Seguenziers'ah sSmtliche beteiligten PABs, sowie FREO 
und BREO z\ir Steuerung der Datentlbertragung auf den Bussystemen (0105a>. 
15 0105b) . 

Die RAM-PAE weist in diesem Ausgestaltungsbeispiel einen dedizierten lO- 
Cannel (0501) auf, Qber welchen sie gg£. aucb selbststcUidig (z. B. Ober XSMK- 
Kontroller) Daten von oder zu peripheren Einheiten (z.B. 10, Speicher) 
tibertragen kann. Es soil nocbmals darauf hingewiesen warden, dass auch die 
20 ALU-PAEs einen solchen dedizierten AnschluS aufweisen k^nnen oder in einer 
weiteren Ausgestaltungsvariante die ALU-PAE anstatt der RAM-PAS einen 
derartigen AnschluS besitzen kfinnte. 

Optional sind eine oder mehrere Datenaustauschvorricht\mgen xoit den 
restlichen Zellen des PAs (z, B. Punktions- und/ oder Speicher zellen) 

25 ixoplementiert. tJber Eingabe-Ports (0502) kdnnen Daten von dem PA gelesen 
warden und Ober Ausgabe-Ports (0503) ktfnnen die Daten ausgetauscht warden . 
Die Port werden beispielsweise Ober die CHD-Steuerkommandos read^ort und 
writa.j^rt angesteuert und schalten die Bussystema entsprechend. Mit den 
Steuerkoinmandos wird ein Selektor ttbertragen, der anzeigt welcher Port durch 

30 das Steuerkoinmando angesprochen ist. 

Die vorliegend offenbarte Iiage der Register innerbalb der RAU-PAE ist 
ungewChnlich, bietet .aber zwei erhebliche Vorteile: 

a) Speicherzellen kfinnen £Ur die Register verwendet werden. 

b) Die Pointer liegen direkt in der RAM-PAE, wodurch Datenzugriffe auf den 
35 Speicher besonders schnell werden. Desweiteren ist fllr ScUntliche Speicher- 

Zugriffe nur ein Bus auf dem Bussystem 0105 notwendig, wobei der 
normalerweise zus£ltzlich erforderliche Adressbus entfSlllt, da die Adressen 
lokal in der RAM-PAE durch die Pointer gegeben sind. 

Diese Anordnung wird daher als vom Anmelder bevorzugt typisch iinplementiert. 

40 

FOr samtliche Datentransfers ist die Lage der Register zu l)eachten. Xftn 
lediglich mttglichst einfache Befehle im Sequenzer zu iinplanentieren, sind 
daher besondere Befehle zur Registermanipulation vorgesehen: 
xnoveta Rrr: Ladt das Register Rrr (rr e {l..n, sp, pp, 
45 fp, ap}) nach Ra 

movetb Rrr: lAdt das Register Rrr nach Rb 
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inovefx Rrr: Schreibt das Register Kx nadh Rrr 



5 



Vm den Daten£lu6character der AZiU zu wahren, ist bevorzugt ein weiterer 
biesonderer ppCode implementiert: 

feed: t)bertragt Da ten von Ra/Rb nach Rx, ohne diese 



zu xnanlpulleren. 



10 



Nachfolgende Belsplele verdeutXichen die Arbeitswelse des Sequenzers: 
Addiere Register Rl zu Register R2 und schreibe Ergebnis nach Register R2 : 
moveta Rl; movetb.RS; add; movefx R2; 



Schiebe Register R4 xiach Register R7: 
inoveta R4; feed; inovefx R7; 



15 Obertrage R5 auf Stack: 



moveta R5; feed; push; 
Anxnerlcung: push ttt>ertragt Daten des Registers Rx an die Speicherstelle auf 
die Rsp zeigt und dekrementiert (bzw. inlcermentiert) Rsp. 

20 Setze Adresspointer Rap mit der indirekten Adresse R4 addiert zu R7: 



Lade Daten aus speicherstelle Rap nach Rl: 
load; feed; movefx Rl; 
25 Amoerlcung: load tSbertrSgt Daten von der Speicherstelle auf die Rap zeigt nach 
Ra. 

Die Datenregister werden bevorzugt innerhalb des Speichers der RAM-PAE 
angeordnet/ z. B. von Adresse 0x0 bis 0x7 (fOr n = 7) . Register werden 
30 beispielsweise angesprochenr indem beim Auf treten des entsprechenden CMD 

SteuerkonmandoS' (z, B. reacLjreg, write_jreg) die Regis temunnner mittlbertragen 
wird, diese ails Adressia an den Speicher tUbertragen wird und die hOherwertlgen 
Adressbits mit 0 gefailt werden. 

Die Startadresse ftir den Code ware dann beispielsweise 0x8 (also Ox(n+l))r 
35 worauf dann der Progrdxanqg>ointer Rpp nach einem Reset zeigen wUrde. 

Die Adresszeiger werden bevorzugt nicht im Speicher abgelegt, sondem in 
gesondert implementierten Registem untergebracht, \3m eine schnelle und 
einfache Aufschaltung auf die Adressleitungen des Speichers zu erm5glichen. 

40 In Figur 5b ist eine Architekturvariante mit Registersatz innerhalb der ALU- 
PAB dargestellt. Die urostandlichen Regis ter trans feroperationen entf alien 
damit, wodurch diese Variante auch erheblich schneller in der 
Datenverarbeit\mg ist. Allerdings ist sind die Hardwarekosten hOher, da der 
Registersatz zusatzlich implementiert werden muss und ftlr samtliche 

45 Speicherzugrif fe die Adressen von der ALU-PAE an die RAM-PAE tabertragen 
werden raOssen. 



moveta R4; movetb R7; add; movefx Ra; 
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RAMoverPAE 

. bie iia<^tolgend Ausgestaltuhg einer ALUtPAE (im 

Folgenden mit ROP-FAB bezelchnet) eignet slch besoiiders fttr VFDs, deren 
Applikation irregular e sequent! el ie Codes aufweisen, die auf kleine 
5 DateiUQengen in einer weitgekend vingeordneten Reihenfolge zugreifen. 

Zur Realisierung dieser Aufgabe wird in eine ALU-PAE Speicher integriert 
(Integrated RAH = XRAM) , au£ den die ALU direkten Schreib/Lese-Zugrif f 
besitzt. Die ALC ist entsprechend vm eine Adressvexwaltungsschaltung 
10. erweitert. Insbesondere kdnnen daher PAEs nach dem vorst^end beschriebenen 
Aufbau (IPAEs) verwendet werden, wobei der separate RRAM ggf . entf&llt und 
durch den integrierten XRAM ersetzt ist Oder der RRAM zusatzlich zum intexnen 
, XRAM quasi als ^peichererweiterimg vorgesehen ist. 

15 Xn einer besonders bevbrzugten AusfGhrung ist ein Seguenzer bzw. 

Microcontroller mit einem bevorzugt limitierten aber bevorzugt vollstandigen 
Befehlssatz (vgl. ARC Microprocessor) in der ROP-PAE integriert, der die 
Verarbeitxmg sequentieller Codes emOgiicht. Xn einer weiteren 
AusfOhrungsvariante kann der Seguenzer in seiner Funktion und seinem 

20 Ablau£verhalten auch konfigurierbar ausgestaltet sein (vie beispielsweise 

xlach dem Stand der Technik bekannt, z.B. durch EPS448 von Altera [ALTERA Data 
Book 1993]). Der Secjuenzer /Microcontroller kann auf Zust&ide (z.B. 
Status signale^ Ereignisse) in der ROP-PAE und/oder auf ZustSnde (z. B. auch 
Trigger) anderer PAEs die ndt der ROP-PAB verbunden sind (z.B. fiber ein 

25 . BuBsystem) reagieren. 

Der Seguenzer /Microcontroller liest seine Programmbefehle aus dem XRAM. 
Die Zugriffe auf das Bussystem des Arrays (PA) entsprechen den fiblichen PABs, 
ebenso die Generierung, der Enpfang vmd die Weiterleitung von Statussignalen 
(Trigger nach PACT08) , Melirere Busanbindungen ftlr Daten- und Triggereingange 

30 und fUr Daten- und TriggerausgSnge kdnnen vorges^en sein. 

Die ROP-^PAB kann Operanden vom Bus lesen ggf . mehrzyklisch Verarbeit«a und 
das Krgebnis wieder auf den Bus schreiben. 

Xn die ROP-PAB ist in einer bevbrzugten Ausgestalttmg ein Registersatz 
integriert. Der Registersatz kann in einer besonderen Ausgestaltung ^Lhnlich 

35 des Registersatzes von Transputem als Stack organisiert. Dadurch kann der 
Registersatz besonders klein tmd hardwaretechnisch eff izient realisiert 
werden (typischerweise reichen 3 Register A, B und C aus). Weiterhin ist aus 
der Transputer technologic bekannt, dass Coxcpiler eff izient mit einem 
derartigen hardwaretechnisch kostengfinstigen Registersatz arbeiten k(}nnen. 

40 EbenfalXs kann der Registersatz optional im RRAM liegen. 

In einer bevorzugten AusfOhrung besitzt die ROP-PAB direkten Anschlufi 
(EXTBaS) an ein extemes RAM und/oder externe 10. Es kOnnen 
applilcationsabhdngig mehrere EXTBUS vorgesehen sein. Xn einer dabei besonders 
45 bevorzugten Ausgestaltung kann der ESCTBQS Ober eine, ggf. dedizierte, 
Verbindung des PAB-Bussys terns an eine Interface-Baugruppe (lOAO) wie 
beispielsweise aus DE 196 54 595.1-53 oder DE 102 06 653.1 bekannt 
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realisiert sein. Die Ansteuerung von Speicher (RAM) xoid/oder Peripherie {10) 
' . erfblgt dabei durch die intetrCacerBaugrijppe. 

In einer bevorziiigten Aus£(ttirung kanh die ROP-^PAiB und dkbei- bev^orzugt das ZRAM 
5 direkt selbstSndig Adressen ftir das exteme RAM und/oder die exteme 10 
und/oder andere interne Speicher (RRAM/IRAM) generieren und exteme oder 
interne Datentransfers selbstSndig steuem. Diese Funktion kann durch 
eigenstandige im RRAM implementierte Adressgeneratoren realisiert werden. 
Beispielsweise eignen sich DMA-Kontroller besonders fOr diese Aufgabe* indem . 
.10 sie blocks^eise Daten zwischen den Speichem k^ieren.. Der Adressraum der zu 
lesenden Daten und der Zieladressraim wird entsprechend gesetzt und der 
Kopiervorgang wird gestartet. Das Setzen kann durch die XPAE erfolgen. 
In einer hardwaremasig au£wendigeren tOsung kann die Funktion durch eine 
isoplementierte MemoryManagementUiiit (MMQ) realisiert sein. Die Funktionsweise 
15 1st durch den Stand der Technik def iniert und bekannt. ZusammengiBfa&t 
arbeitet eine MUd wie folgt: 

Der von der MMO verwaltete RRAM Speicher ist in roehrere Seiten (Pages) 
aufgeteilt. Jede Page en thai t Daten eines. virtuellen Speicherraumes innerhalb 
eines extemen Speichers. Beispielsweise kdnnen die hexadezimalen RRAM- 

20 Adressen OxOaOO. .OxOaff Daten des extemen Speichers an den Adressen 

0xbdl3200. .03d>dl32ff enthalten. Zur Verwaltung der Adressumsetzung wird eine 
Adresstft>ersetzungseinheit verwendet, die gewOhnlicherweise durch Lookvq^- 
Tabellen realisiert ist. Au£gabe einer MMQ ist es insbesondere einen groSen 
Speicherraum auf einen sehr viel Kleineren (in diesem Fall der RRAM) zu 

25 tibersetzen. Dies geschieht derart, dass Seiten je xiach Bedarf von dem grofien 
Speicherraum in den Kleinen kopiert werden. Sobald eine- Seite nicht mehr 
ben<}tigt wird kann diese geldscht und/oder ttberschrieben werden. Wenn die 
Daten auf der Seite ver^ndert wurden, wird die Seite bevorzugt vor dem 
Ldschen/tJberschreiben in den-groSeh SpeicberrauiR zurflckgeschrieben. 

30 Die Adressumsetzungseinheit arbeitet derart, dass ein hdherwertiger Tell der 
physikalischen Adresse (also die Adresse der Seite) in dem Loolcup-Speicher 
abgelegt wird iind auf die entsprechenden Daten der Seite im RRAM zeigtf , 
sobaid die Seite innerhalb des kleinen Speichers (RRAM) verfdgbar ist. 
Dadurch kann ein Zugriff auf die Seite erfolgen. Fehlt die Seite im RRAM ist 

35 auch keine Referenz eingetragen. In diesem Fall muss die Seite erst' von dem 
grofien (extemen) Speicherraum in den RRAM kopiert werden. Hierzu kann eine 
andere bevorzugt aktuell nicht verwendete Seite gem^ dem vorstehenden Ablauf 
Uberschrieben werden. 

Das Ropieren Icann dabei automatisiert, also ohne wesentliche Beteiligxmg 
40 durch den Sequenzer erfolgen, indem von der MMD ein EMA-Kontroller 

angesteuert wird. Diesem werden die entsprechenden Seitenadressen im RRAM und 
extemen RAM, sowie die Seitengrdfie durch die MMcr zur Verfflgung gestellt (z. 
B. in Register eingetragen) . 

45 Die R0P-PAB besitzt einen AnschluE an eine Konfigurationseinheit die die R0P- 
PAE entsprechend des tlblichen Verfahrens konfiguriert tind rekonf iguriert. In 
einer bevorzugten AusffUirung kann die CT auf den XRAM lesend und/oder 
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scbreibend zugreifen, im Daten und/oder Code ftlr den Sequenzer im IRAM zu 
• ; yerwalteri. ' 

In einer besonders bevorzugten Ausgestaltung kann die ROP-PAE selbstdndig 
5 Code £ar den Sequenzer iXbex das PA Bussystem und/oder den EXTBUS aus dem 
extemen RAK laden. 

In einer bevorzugten AusfOhrung ist der IRAM in mehrere Segmente unterteilt, 
die in unterschiedlichen Adressbereichen liegen. Die Seginente kdnnen 
10 beispielsweise ftlr einlge der folgenden Funktionen aufgeteiXt sein: 

Sequenzer speicher, Stack (z.B. fttr Registersatz) , Datenspeicher, Heap, 10- 
Puffer, Puffer, zu extemem RAH bzw. Cache, Loolcuptabellen, Konfigurationen 
ftlr PAEs und/oder Busse, der Registersatz der ROP-PAE. 

Je nach Funktion kannen dazu folgende AnsteueriDechanisxnen vorgesehen seln: 
15 Sequenzer- /Code-Speicher: Frogrammzeiger auf die entsprechenden 
Speicherstellen (Rpp) . 

Stack: Stackzeiger auf die oberete Speicherstelle dee Stack (Rsp), 
gegebenenfalls auch ein FramePointer (Rfp) # wie er nach dem Stand der Tecdmik 
(2,3, Intel Pentium) belcannt ist. 
20 Konfigurationen ftlr PAEs und/oder Busae: Hieanrauf kann ein Zeiger innerhalb 
der CT und/oder inplenentierungsabhangig ein Zeiger innerhalb der 
Konfigurationssteuerung der PAE zeigen. 

Registersatz der IPAE: Sollte der . Registersatz der PAE im Speicher 
untergebracht sein, wir dieser direkt d\2rch die PAE nit bevorzugt 

25 hardwauretechnisch fest vorgegebenen adressiert. 

Die restlichen Spelcherbereiche, wie Datenspeicher, Puffer, Tabellen werden 
typischerweise durch den Ccmqpiler oder Programmierer aufgebaut* Die 
Adressierung dieser Bereich erfolgt durch das auszuftShrende Programm und/oder 
Betriebssys terns und vrird innerhalb der Programmes und/oder Betriebssystems, 

30 ggf. unter Zuhilfenahme der Registersatzes \md der ALU des Sequenzers, 
berechnet. 

In einer miigiichen Vari ante ist der IRAK kpniplett Oder teilvelse, wie bei den 
IPAEs beschri^ben, durch RAM-PAEs auEerhalb der ROP-PAE realisiert. Fth: ggf. 
unterschiedliche Segmente kOnnen unterschiedliche RAM-*PAEs verwendet werden. 

35 . 

In einer bevorzugten Ausgestaltung kOnnen einige oder alle Segmente als 
aktive Speicher ausgestaltet sein, also eine DMA und/oder MMU besitzen und 
somit selbstandig Daten in oder aus den ihrem Speicher von oder nach anderen 
Speichem oder PeripheriegerSten kopieren. insbesondere kfinnen sie die 

40 Funktionen der Speicher aus der DE 199 26 538.0 aufweisen, z. B. FIFO, 
Stack, Random Access, Cache, etc., wobei ftlr jedes Segment einzeln die 
Funktion konfigurierbar und/oder durch den Sequexizer programmierbar ist. . 

In einer Ausftihrung kann der IRAM als Multi-Port Speicher ausgeftlhrt sein. 
45 Dieser kann den ggf. auch gleichzeitigen Schreib- und/oder Lese-Zugriff durch 
mehrere Speicherzugriffseinheiten auf den Speidherinhalt ermaglichen. 
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Speicherzugriffselnheiten kOnnen beisplelswelse exteme und/oder interne 
Peripherie,.. Prbzessoren, andere / 

In einer besonder^ Ausffihrung Icann die ROP-PAE ais iokaXe und gg£. aucii 
5 globale Konf igurationseinheit ahnlich einer CT fOr ROP-PAEs in der Utagebung 
arbeiten oder unter euiderem diese Funktion mit erfttllen. Bevorzugt arbeitet 
die ROP-PAE nach dem aus der DE 196 54 846.2-53 bekannten Verfahren bei der 
Verwendung als lokal Konf igurationseinheit , Wird die ROP-PAE als globale 
Konfigurationseinheit yerwendet, oder hat sie sehr viele lokale PAEs zu 

10 konfigurieren, wird bevorzugt das. Verfahren nach. der DE 196 -54 593.5-53 

verwendet, das eine FILMO-Punktionalitat aufweist und daher sehr viele auch 
unabhangige Konf igurationen verwalten kann. Die ROP-PAE adressiert gesteuert 
durch dieh Seguenzer/Microcontroller Kbnfigurationen im ZRAM und konfigurlert 
diese an PAEs und/oder sich selbst und/oder best immt den Ablauf des 

15 Sequenzers /Microcontrollers. Bevorzugt findet hierbei eine Synchronisation 
mit einer Cbergeordneten Konfigurationseinheit (z. B. CT oder andere PAEs) 
ahnlich der bekannten Inter-CT-Protokolle (DE 198 07 872.2, DE 100 28 397,7 , 
DE 199 26 538.0 ) statt. Die ROP-PAE kann Konf igurationen Ober eines der 
EXTRAH- Interfaces selbst laden und/oder Konf igurationen von einer 

20 tlbejrgeordneten Konfigurationseinheit Ober das CT Interface anfordem. Die 
Punktionsweise kann ahnlich der Rekonf igurationseinheit in der DE 196 54 
846.2-53 sein. 

Zusammengef aSt ist der prinzipielle Arbeitsweise einer ROP-PAE ahnlich eines 
25 Microcontrollersystemes, des sen Busanbindung und/oder dessen Datentransfers 
und/oder dessen Programnablauf einem VPa-System entspricht. Mit anderen 
Worten handelt es sich um eine UUltiprozessoranordnung, deren Bussystem auf 
dem Prinzip der VP0-Architektur berijht. Die einzelnen Prozessoren werden von 
tevorziigt von einer Cbergeordneten Steuereinheit (CT) verwaltet. Die 
30 Datentibertragung ist selbstsynchronisierend tiber die RDY/ACK Protokolle der 
Bussystieme. Als ein besonders wesentlicher Aspekt wird der gemeinsame 
Prozessorstatus angesehen, der. Hber das Triggerbussystem reprasentiert wird 
und den Status einer Menge von Prozessoren reprasentiert, der unter den 
Prozessoren zur Ablauf steuerung ausgetauscht werden raufi. Bierzu wird 
.35 verwiesen auf DB 197 04 728.9, DE 101 39 170.6 und DE 101 29 237.6-53. 

Ebenfalls wird Schutz beansprucht fOr ROP-PAEs, die zusatzlich zu ihrem 
Anschluss an die intemen Bussysteme des Arrays aus PAEs einen dedizlerten 
Anschluss (lO-Channel) an ein Qberregionales Bussystem aufweisen, das 

40 insbesondere Daten tiber lange Strecken innerhalb des Arrays tibertragt 

und/oder insbesondere einen direkten AnschluS an die Peripherie aufweist. Der 
Anschlufi an die Peripherie kann dabei direkt erfolgen, indem z. B. das 
BvLSsystem bereits dem peripheren Protokoll entspricht oder tiber entsprechende 
Protokollwandler ztar Uffisetzung des Protokolls erfolgen. Dsis dedizierte 

45 Bussystem kann dabei bereits einem Industriestandard entsprechen, z. B. PCI, 
RapidIO, Firewire, USB, Ethernet, RAMBUS, DDR-RAM, etc. \m somit einen 
einfachen und unaufwendigen Anschluss der peripheren Gerate zu ermSglichen. 

25 
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Gegebenenfalls k6nnen auch in zwischengeschalteten lOAGs (vgl. DE 196 54 
5SI5.1-53 j Prdtokollkonvertiervingen derart dxirchgefOhrt werden 
internes vereinfachtes xmd ggf . proprietSires Busprototoll auf ein oder 
mehreria konqplexere exterxie Staiidardprotokolle t&ersetzt warden. 
5 Es soil besonders darauf hingewiesen warden, dass unter Peripherie auch 

Speicher verstanden warden, wie bei den bereits aufgezShlten Busprotokollen 
verdeutlicht wird. 

Ebenfalls ist erf indungsgemafi besonders relevant, dass PAEs auch mehrere 
AnschlUsse an dedizierte Bussysteme aufweisen kOimen. 
.10 Desweiteren sind anwendungsalahangig auch Architekturei^ sinnvoll, bei denen 

nur eine Teilmenge der PAEs AnschlUsse an ein dediziertes Bussysten aufweist, 
. Oder unterschiedliche PAEs mit einer unterschiedlichen Anzahl von AnschlUssen 
an gg£. auch unterschledlic^he dedizierte Biissystemis aufweisen. 

15 Die beschriebene Struktur kann durch^erweiterte- iind verbeeserte 

Halbleiterherstellungsverfahren und -strukturen besonders leistungsfahig 
in^lementiert warden, indent der Speicher auf dem physikalischen Chip raunCLich 
tlber Oder unter den logischen Funktionen {ALU, Steuerung, Busse, etc.) der 
PAE angeordnet wird. HierfOr wird Schutz beansprucht. 

20 Dazu wird tJber der nach dem Stand der Technik bekannten ersten 
Halbleiterstruktur (z. B. Silizium) und der damit aufgebauten 
Transistorstrukturen eine oder mehrere weitere Cbenen von 

Halbleiterstrukturen (Transistorstrukturen) aufgebracht, die ftb: zusSltzliche 
Funktionen genutzt werden k6nnen. Beispielsweise k5nnen in einer ersten Ebene 
25 . die Logik und Qatter der PAE-Funktion und in einer weiteren zusatzlichen 
Ebene die £lpeicherfunktionen inplementiert werden. 

In einer bevorzugten Bauweise werden die einzelnen Halbleiterschichten durch 
eine Xsolierschicht voneinander getrennt. Die Xsolierschicht kann 
Durbhkontaktierungen (Vias) aufweisen, um Signals zwischen den einzelnen 
30 Halbleiterschichten zu Obertragen. 

Die Ver dr ah tungs struktur kann je nach Anwendung unterschiedlich inplementiert 
se.in. Beispielsweise kdnnen direkt fiber je^^ 

Verdrahtungsebenen und/bder eine globale Verdrahtungsebene, die alien 
Halbleiterschichten zugeordnet ist vorgesehen 8ein« 

35 

Ota eine wirtschaf tliche Ausbeute zu erlangen, muss sichergestellt sein, dass 
die Gesamtschaltung, also alle Halbleiterstrukturebenen zusammen, eine 
hinreichend hohe Ausbeute erreichen. Desweiteren ist zu beachten, dass der 
Stromverbrauch, also die Verlustlei stung, aller Halbleiterstrukturebenen 
40 zusaimuen innerhalb eines akzeptablen Bereiches bleibt, der zu keiner 
Oberhitzung und dem daxnit verbondenen Aus fall der Schaltung fflhrt. 
Bs kann durch eine geeignete Zusaxnmenstellung der Funktionseinheiten der 
einzelnen Halbleiterebenen den entsprechenden Anf orderungen entsprochen 
werden. 

45 Beispielsweise ist ftlr die vorgeschlagene Architektur eine Ebene von 

I*ogikhalbleiterstruktiiren und eine weitere Ebene von 

Speicherhalbleiterstrukturen vorzusehen, die fOr diese Anforderungen geeignet 
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sind. wahrend die Irregularen xind wenig redundanten Logllchalblei ters trukturen 
. einei vergleichsweise liohe Fehlergubte mit hoher Verlustleistung . aufweisen, 
k&nnen Speicherhalbleiters trukturen vergleichsweise redundant mit niederer 
Fehierquote und durch geeignete Speicherverfahreh (z. B. DRAM) auch mit 

5 geringer Ver lust lei stmg inqplementiert warden. Es wird explizit darauf 

hingewiesen, da& es mdglich ist, Felder vorzusehen, bei welchen nicht alle 
Speicherpiatze und/oder alle Logikhalbleiters trukturen voll funktional sind; 
es ist lediglich erforderlich, Mindestanf orderungen sicherzustellen und/oder 
eine or dnxmgsgema fie Verwaltung. Redundanzen sind bevorzugt tax beide 

10 Strukturen separat zu betrachten. 

Die Aufbringung der mehrfacb tibereina&der liegenden Halbleisterstrukturen 
kann nach unterBchiedlichen Verfahren erfolgen. Neben dem bereits 
beschriebenen Veirfahren des Aufbringens einer weiteren Halbleiterebene Ober . 

15 einer Isolierschicht, was z. B. durch AuCdan^f en luid/oder Aufkristallisieren 
erfolgen kann, sind auch thennische Oder nechanische Verbindungen m()glich, 
indem z. B. die aufzubringende Siliziiunstruktur aufgeldtet- oder aufgeklebt 
wird. Zum Aufl6ten eigenen sich beispielsweise auch Verfahren, die aus den 
Technologien zum Verbinden von Halbleiterchips mit Gehausen bekannt sind. 

20 Dabei handelt es sich beispielsweise \m Reflow-LOtung Oder olienaokompression. 
Prinzipiell sind auch die einfache mechanische Verbindungsmethoden mfiglich, 
wobei sodemn die Verdrahtung beispielsweise per Wirebond erfolgen kann. 
Voraussetzung hierfOr ist, dass die Siliziumstrukturen unterschiedliche 
Grdfien aufweisen, sodass die DrSOite von einer Siliziumstrukturoberfia.che ztir 

25 ndchsten gedrahtet werden k25nnen und, dass die Anzahl der Verbindtmgen 
vergleichsweise gering ist, damit diese mittels Wirebond noch realisiert 
werden kOnnen. 

Zur Optimierung der Aiisbeute kann insbesondere daia Redundanzverf ahren hadb DE 

30 197 57 200.6-33 angewendet werden. Es soil erwaimt sein, 6aBB das Verfahren 
nach DE 197 57 200.6-33 fOr alle PAEs vorgesehen werden kann, also z. B. fiir 
AIiU-PAEs genauso wie fOr RAM-^PAEs. Mit anderen Worten kdnnen fflr samtliche. 
PAEs das in DE 197 57 200.6-33 beschriebene Redundanzverfahren angewendet 
werden. Auch die dortigen Textverfahren sind implementierbar . 

35 Ftir PAEs nit hauptsachtlich feingranularen Strukturen, also z. B. Speicher 

(RAM-PAEs) Oder FPGAs ist es von Vorteil, diese feingranularen Strukturen mit 
einer entsprechend feingranularen Redundanz zu versehen, d. h. nicht oder 
nicht nur die RAM-PAB Oder eine eine FPGA-Struktxir aufweisende PAE mit einer 
redundanten PAE zu versehen, sondem die feingranulare Struktur selbst mit 

40 Redundanz zu versehen. Das heisst, dass beispielseise den Speicherzellen 
(bzw. FPGA-Zellen) redundante Speicherzellen (bzw. FPGA*-Zellen) zugeordnet 
werden. Die Verbindimgen (Leitungen, Busse, etc.) zwischen den jeweiligen 
Zellen sind dann entsprechend an die Erfordemisse einer redundanten Strukt\ir 
angepafit. Der Aufbau redundanter Strukturen fUr feingranulare Zellen, wie z. 

45 B. Speicher oder FPGAs ist durch den Stand der Technik bereits bekaimt. FOr 
das Verstdndnis von Ausgestaltungsdetails wird auf diesen verwiesen. 
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Die Verlustleistimg ISi&t sich nach den Verfahren DE 1^6 51 075.9-53 und 
DE 101 35 210,7-53 erhebiich iiiiiaimiererii wodurigj^^eAr'/ hohe 
Integrationsdichten erm&glicht werden. 

S Es soil darauf hlngewlesen werden, dass die Anzahl der tibereixianderliegenden 
Halbleltersturkturen kelneswegs auf zwel begrenzt ist. Hit f or tsclirei tender 
technischer Eatwicklung und Qptimierung ist eine steigende, auch sehr groSe 
Zabl von tOdereinanderllegenden Ebenen realifiierbar. 

10 Die. Ebeneziaufteilung.muS. dabei, weder bei einer zweilagigen, noch. bei einer. 
mebrlaglgen Struktur auf eine ALU-Speicher-auf teilung limitiert sein. Bereits 
bei zweilagigen Strukturen kann es sinnvoll sein den Speicber zxiscomnen mit 
den ALUs in eine Iiage zu legen imd die andere Lage lco(nq;>Xett fOr die 
Bussysteme oder die Bussysteme und lO-Ansteuerungen (XOAGs) zu verwenden. Die 

15 Bussysteme kdnnen dabei iXbet die einfache Verdrahtung hinaus bevorzugt aucb 
die Schaltelemente (Multiplexer, Transmission-Oatesi etc*} und/oder 
Vers t^ker el entente (Trelber, etc.) und/oder Synchronis at ionsel entente 
(RDY/ACK-Steuerung) , die Jewells Halbleiter strukturen zu der en Realisierung 
benOtigen enthalten. 

20 Desweiteren kann es sinnvoll sein, eine Ebene ftlr die Konfigurationsspeicher 
und/oder Konfigurationsregister und/oder CT und der en Speicher vorzusehen. 

Figiir 6 zeigt eine Iraplementierung einer ROP-PAE. Architektonisch wurde die 
RAM-PAE iimerhalb der ALU-PAE inplementiert. Der gesamte Regis tersatz 

25 (RO..Rn, Rsp, R£p, Rap) iet in der ROP-PAE.untergdbracht. Zugriffe auf 

die Register durch die ALU sind schnell und mit geringem Auf wand aidglicb. 
Adressen und Daten kOnnen direkt von der ALU an den Speicber tSbertragea 
werden, obne ein Bussystem auEerhalb der ROP-PAE wie z. B. 0105 zu benOtigen. 
Bevorzugt weist eine ROP-PAE einen oder mehrere dediziierte lO-Channel zur 

30 Datenflbertragung mit der Peripberie auf (beispielsweise 0601, 0602). 

Datenverbindungen zu den restlichen PABs kdnnen wie bereits bekannt durcb 
FRE6 und/oder BHsa realisiert werden.. Hier angedeutet durch den Leseport 0603 
und Schreibport 0604 . 

Bevorzugt sind ROP-PAEs bereits intern als Sequenzer ausgebildet und weisen 
35 damit bereits eine interne ROckkoppltrng des ALU-Ausgangs auf die Register 
auf. Optional kann dies auch durch die Verwendmg eines ROP-PAE extemen 
Busses (z.B. 0105) und einer RQcScikopplung durch ein BRE6, wie bereits belcannt 
erfolgen (0605) • 

40 FigiiT 7 zeigt verschiedene Aufbauvarianten von Halbleiterstapeln: 

Figur 7a zeigt einen einfachen Aufbau mittels Wirebond Verbindungen zur 
Datentlbertragung (0701), bei welchen zwei Dice (0702, 0703), also zwei Chips, 
aufeinander niontiert sind. Ein Chip besteht stark vereinfacht aus einer 
Halbleiterebene zur Realisierung von Transistoren (z. B. Siliziuni/ 0704), 

45 xnehreren Metalllagen zur Realisierung von Verbindungsleitungen (z. B. 

Aluminium \ind/oder Kupfer; dzirgestellt sind 3 Lagen 0705a/b,c), die jeweils 
durch eine Isolierschicht untereinander und gegentUber 0704 elektriscb 
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getrennt sind, und eine obere, besonders wlderstandsfahlgen isolierschicht 
elektrischen Verbindung der einzelnen Ebenen, sogenannte ViaS/ eingefttgt, 

5 In Figur 7t) sind die belden Dices inittels einer Art Flip-Chip-Teclmologie 
miteinander verbunden, wobei die dbertragung von Signalen durch sogeziannte 
Bumps nach dem Stand der Technik er£olgt. Zusatzlich zu den durch die Flip- 
Chip-Technologie gegebenen M5glichkeiten des Anschlufi von Bmops (0711) au£ 
der jeweils obersten Metalllage; soil hier die besondere er£indungsgem£lSe 

10 Ausgestaltung gezeigt warden, die Bumps luiterhalb der Halbleiterschicht (z.B. 
Silizium) zu kontaktieren. Dazu werden elektrische Verbindungen (z.B. 
Aluminium oder Kupfer), also Vias (0712), doxch die Siliziumschicht nach 
unten gefOhrt. Die DurchftUmmg erfolgt bevorzugt durch Atzen von 
entsprechenden LOchem In die Halbleiterebene . Zwischen den Verbindungen und 

15 der Halbleiterschicht wird eine Isolierung eingefttgt. 

Die DurchfChrung kann vie bei Figur 7d angedeutet entweder direkt durc^ die 
Halbleiterschicht erfolgen oder es werden, wie bevorzugt, zun£lchst Wannen 
(0731) in die Halbleiterschicht geatzt, die mit einer Isolierung gefttllt 
werden und in welche dann die Vias eingebracht werden. 

20 

Figur 7c zeigt die besonders bevorzugte Variante zur Realisierung von 
Halbleiterstapeln. Oberhalb der obersten Isolierschicht (0721) einer ersten 
. Halbleiterstruktur, die in diesem Fall dOnner auafallen kann, wird eine 
weitere Halbleiterebene (0722) aufgebracht. Dazu wird die Isolierschidht 

25 (0722) zunachst durch Atzen und/oder Schleifen mesglichst eben geroacht. Das 
Aufbringen der Halbleiterschicht Icann durch Aufdanpfen, Aufziehen von 
Kristallen oder bevorzugt durch Aufkleben oder klebedhnlichen Verbindungen 
auf gelaracht . Wesentlich, v. a. bei der Verwendung von Verklebungen ist, dass 
durch die aufgebrachte Halbleiterstruktur und das Verbindungsmaterial (z.B. 

30 Klebematerial) durchgeatzt werden kann. Die DurchAtzung ist er£orderlich, um 
Kontakte, wie in Fig. 7b beschrieben zu dien Vias in der darunterliegenden . 
.. Isolierschicht zu. £Ohreri. 

Die Durchftthrung der Kontakte erfolgt gemas Figur 7d z. B. durch das Einatzeh 
.schmaler Kanaie, in die ein Isoliermaterial eingebracht wird. Danach wird in 

35 einem weiteren Schritt in das Isoliermatierial ein schmaleres Via eingefttgt, 
indem z. B, zuvor in dem Isoliermaterial ein Loch entsprechenden Durchmessers 
z. B. durch iltzen erzeugt wurde. 

Das bevorzugte Verfahren sieht das Atzen grfisserer Wannen (0731). vor, welche 
..mit Isoliermateriea ge£ttllt werden. In die Wannen werden dann gg£. mehrere 
40 Vias (0712) wie beschrieben einge£ttgt. 

Die. Piguren 7e,£,g,h zeigen verschiedene bevorzugte funktioneile Aufteilungen 
solcher Halbleiterstapel. Die Halbleiterebene ist jeweils schraffiert 
dargestellt und die Isolierschicht durch dicke TAnrandung. Dazwischen liegen 
45 die MBtalllage. Wie in Fig. 7g,h angedeutet ist die Konstruktion nicht au£ 2 
Stapel besc^ankt, ebenso sind grfiSere Stapel, z.B. mit 3,4, oder mehr £benen 
mOglich. 



wo 03/036507 



PCT/EP02/10572 



Die melurf ache beschri^ene. Au£tre^ ist izi Fig« . 

7e dargeetellt. 

Fig; 7f zeigt die Trexiniing der Bussysteme itiit deh notwendigen Schalteinheiten 
5 und der lO-Struktur von den ALXTs und Speichem, die sich in diesem Beispiel 
in derselben Ebene befinden. 

In Fig. 7g liegen auf der untersten Ebene die ALUs. Auf oberster Ebene liegen 
die Speicher und gg£. die Treiber der 10. Sondt sind die Strukturen mit hober 
. Verlustleistung an den atJifieren RoUadem der StapeX untergebracht . BesonderB 
10. hierfOr wird Schutz beansprucht, da dadurcb eine besonders optimale 

warmeabfuhr xn5glich ist. Die Bussysteme tmd deren Schalteizdieiten sind in der 
xaittleren Ebene untergebracht. 

In dem Beispiel Fig. 7h sind in den mittleren Ebenen verlustleistungsarme 
Busse und Speicher untergebracht. ALUs und die besonders energieaufwendigen 
15 10 sind zur optimaien warmeabfuhr in den R&aderh untergebracht. 

lOx-PAEs 

Aus DB 199 26 538.0 sixid Speicher (lORAK-PAEs) mit einem dedizierten 

Anschluss an exteme Einheiten wie z.B. Peripherie und/oder Speicher bekannt. 
20 Weiterhin sind axis DB 196 54 595.1-53 vind DB 102 06 653.1 dedizierte 

Eiiiheiten (z. BJ Interface-Baugruppen (IBO)) zum Anschluss von extemen 

Einheiten wie z. B. Peripherie \md/oder Speicher be3cannt. 

Beide Verf ahren weisen das Problem auf, da^s ein zus^tzlicher Au£wand zvx 

Datenkomnunilcation zwischen PAEs, insbesondere datenverarbei tender und/oder 
25 datenberechnender PAEs und extemen Einheiten betrieben werden muss, indem 

die Daten explizit . zwischen den PAEs und den IBGs und/oder lORAM-PAEs 

Obertragen werden mdssen. 

Es wird nunmehr erfindungsgemas vorgeschlagen und wie bereits vorstehend 

30 inehr£ach erwdhnt fOr beliebige PAEs, insbesondere jedodh fOr 

datenverarbeitende und/oder datenberechnende PAEs (z. B. ALU- PAEs nach DB 196 
51 075.9*^53 , IPAEs, ROP-PAEs) und datenspeichemde PAEs (RAM-PAEs nach DE 
100 50 442.6 ) einen Oder xaehrere dedizierten AnsciaQsse (ID-Channel) an 
exteme Einheiten wie z. B. Peripherie und/oder Speicher vorzusehen. Dadurch 

35 ist eine direkte Koinmunilcationsin5glichkeit der PAEs, die nachfolgend lOx-PAEs 
genannt werden, und extemen Einheiten gegeben. Der Vorteil dieser 
Architektur liegt darin, daes die Verbindung des Arrays aus PAEs (PA) mit der 
Peripherie (extemeio Speicher und/oder lO-Einheiten) erheblich effizienter 
aufgebaut werden kann. Die bestehenden konfigurierbaren Bussysteme der PAEs 

40 xintereinander (BUS) mttssen nicht mit den lo-Datentransfers belastet werden. 
Desweiteren Icann bei einer entsprechenden Ausgestaltimg des lO-CIhannel die 
Adressierung der Daten fOr oder einzelne PAEs sehr viel einfacher 
durchgefUhrt werden, als dies mittels des BUS mOglich ware. 
Dies kann bevorzugt dadurch realisiert sein, dass jede an einen lO-Channel 

45 angeschlossene Einheit eine eigene eindeutige Adresse besitzt. Mittels dieser 
Adresse kann jede Einheit explizit und einfach angesprochen werden, indem die 
Adresse tlber den lO-Channel tSbertragen wird und jede Einheit diese Adresse 
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iQit ihrer eigenen vergleicht. Wenn die Adressen t&ereinstimmen, ist die 
Einiheit adfessiert und die Daten sind ftlr diese Eiiaheit bestinnat. 
Bevorzugt 3caim jede Einheit nicht nur die Zieladresse, also die Adresse der 
fiixiheit tHz die die Daten beBtizomt sind/ sondem auch ihre eigene Adresse 
5 fiber tragen, ym eine Identifikation des Senders zu exxnOglichen* 

Besonders ef fizient kann das Vorsehen von IO--Channels fUr nur eine Teilmenge 
aller PAEs sein. Beispielsweise bietet es sich an, nur Streifen von PAEs mit 
lO'ChanneX-Brweiterung innerhalb einer. Anordnung von PA£s (PAE-Array, PA) 
10 . vorzusehen.. .I}adurch wird eine verbesserte :Fl&chenr und Kosteneffizienz 
gegenOber der Ingplementierung der ZO-Channel"Erweiterung in alle PAEs 
erreicht. 

PA£s> die besonders hohe Kommunikationsanforderungen aufweisen, kOnnen 
15 applilcationsabhdiigig auch an mehrere lO-Channel angeschlossen sein. 

pie dedizieren lO-Channels kOnnen dabei au£ unterschiedlichen Bussystenen 
au£gebaut sein* z. B. insbesondere nach DB X97 04 742.4 Oder als parsaieles 
Standardbussystem wie lUgpid-IO, PCI, AMBA Oder serielXes Standaixtbussystem 
20 wie USB, Firewire, Ethernet. 

Besonders leistungsf ahig kann die Xisplementierung von lO-CSiannels in PAEs 
dann sein, wenn diese nicht direkt an die extemen Einheiten gefUhrt sind, 
sondem zxmftchst an eine lO-Verwaltungseinheit (XOAQ) , die ahnlich dem 

25 Protokollkonverter nach DE 102 06 653,1 oder der IOA3 nach DE 196 54 595.1- 
53 aufgebaut sein kann. Der Vorzug liegt darin, dass ein einfacbes internes 
Busprotokoll z\xr Steuerung der lO-Channels verwendet werden kann. Ebenso wird 
nur eine geringe "Intelligenz" in jeder einen lO-Channel aufweisenden PAE 
bentftigt, wbdurch die PAEs jeweils fiachenniaRig klein und unaufwendig zu 

30 prograznmieren sind. 

Die eigentliche Verwaltung und Ahsteuervmg der extemen Einheiten wird in den 
lOAGs. durchge£Ohrt, die dxurchaus grtfSer und aufwendiger ausgestaltet sein 
kdimen. 

35 Die lOAGs k^nnen zur BrfUlltmg ihrer Aufgabe selbst eigene Seguenzer void/oder 
Mikrokontroller und gg£. auch eigenen Speicher a\i£weisen. Insbesondere kann 
die lOAO auch Speichermanagementeinheiten und AdressObersetzungseinheiten 
aufweisen. Je nach Applikation kCzmen Interruptkontr oiler wie z. B. nach dem 
Stand der Tecfanik bekaxmte (18259) in der JQAO inplementiert sein, die 

40 Intermpts gg£. au£ Triggersignale nach DE 197 04 728.9 Qbersetzen. 

SIHD PAEs 

Bei der Verwendung von rekon£igurierbaren Technologien zur Verarbeitung von 
45 Algoritfamen entsteht ein wesentliches Paradoxon: (1) es sind, um eine 

maglichst hohe Rechenleist\ing zu erhalten, kon?>lexe ALUs erforderlicb, wobei 
der Au£wand tiXr die Rekonfiguratlon minimal sein sollte; (2) es soli ten die 
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ALUs mAglichst einfach und felngranular sein, ixro elne efflziente 
batenverarbeitung. auf Bitebene zu ermt^lichen; . (3) es sollte die 
Rekonfiguration imd Datenverwalttmg derart intelligent void schnell erfolgen, 
dafi sie ef fizient und einfach zu progirairmieren ist. 

5 

Bisherige Technologien verwenden entweder a) sehr kleine KUJs mit wenig 
ReTconfigurationsuntersttltzung (FFGAs) und sind auf Bitebene effizient oder b) 
groSe ALUs (Cameleon) mit wenig Rekonfigurationsunterstlltzung, oder c) eine 
Mischung aus groSen ALUs xatd kleinen ALUs mit Rekonfigurationsxmterstatzung . 
10 . und Datenverwaltung (VFUs) . . , 

Da die VPU-Technologie die leistungs££higste Technik daurstellt, soli auf ihr 
aufbauend ein optimiertes Verfahren geschaf fen werden. Es soli ausdirtlcklich 
darauf hingewiesen verden, daB dieses Verfahren ebenfalls ftir die anderen 
Architekturen eingesetzt werden kann. 

15 

Der Fldchenaufwand zur ef fizienten Steuerung von Rekonfigurationen ist mit 
einer Menge von ca, 10.000 bis 40.000 Gattem pro PAE vergleichsweise hoch. 
Unterhalb dieser Gattermenge lassen sich in der Regel nxir einfache 
Ablaufsteuerungen realsieren, die die Programmierbarkeit von VFUs erheblich 
20 einschrSnken und eine Verwendung als General Purpose Prozessor erschweren. 
Sofem auf eine besonders schnelle Rekonfiguration abgezielt wird, loQsBen 
zusatzliche Speicher vorgesehen werden, wodurch die erforderliche GatterxDenge 
nochmals erheblich ansteigt. 

25 XJm ein ordentliches Verh^Lltnis zwischen Rekonf iguratlonsaufwand und 

Rechenlei stung zu erhalten, ist somit der Einsatz von groSen ALUs (viel 
Funktionalitat tind/oder grofie Bitbreite) zwingend erforderlich. Werden die 
ALUs jedoch zu groS, sinkt die nutzbare parallele Redhenleistimg pro Chip. 
Bei zu kleinisn ALUs (z. B. 4-bit) ist der Aufwand zur Konfiguration . 

30 aufwendiger Punktionen (z.B. 32 -bit Multiplikation) zu hoch. Insbesondere der 
Verdrahtungsaufwand w&dist in koxmaerzlell nicht mehr sinnyolle Bereiche. 

SIMP Rechenwerke 

35 Um ein ideales Verh£U.tnis zwischen der Verarbeitung von kleinen Bitbreiten, 
Verdrahtungsaufwand \md der Konfiguration aufwendiger Punktionen zu erhalten, 
wird nun der Einsatz von SIKD-Rechenwerken innerhalb von ALU-PAEs (also 
insbesondere der in dieser Erfindimg offenbarten PAEs, ebenso wie in PAEs 
nach DE 196 51 075.9-53 und DB 199 26 538.0 ) vorgeschlagen . Dabei werden 

40 Rechenwerke der Breite m derart zerteilt, dal^ n einzelne B16cke der Breite b 
s m/n entstehen. Durch Konfiguration wird je Rechenwerk vprgegeben, ob ein 
Rechenwerk unzerteilt arbeiten soil, oder ob das Rechenwerk in einen oder 
mehrere BlOcke, jeweils gleicher Oder unterschiedlicher Breite zerlegt sein 
soil. Hit anderen Worten kann ein Rechenwerk auch derart zerlegt sein, daft 

45 innerhalb eines Rechenwerkes txnterschiedliche Wortbreiten zugleich 

konfiguriert sind (z.B. Breite 32-bit, zerlegt in 1x16-, 1x8- und 2x4-bit) . 
Die Daten werden derart zwischen den PAEs Obertragen, dafi die zerlegteh 
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Batenwoirte (SIND-WOKD) ssu Datenworten der Bitbreite m zusaiimengefafit werden 
wid ais PaJcet dber das Netzwerk tibertragen werden. 

Das Netzwerk ObertrcLgt ixnzner ein kon^Xettes Paket, d.h. alle Datenworte 
ixmerhaib elhes Paketes; und weirden hach dem bekannte Handshake-Verfahren 
5 tibertragen. Einzelne Datenworte innerhalb dee Paketes k6nnen dabei auch 

unbenutzt sein, d.h. keine Information enthalten. Dies kann dtirch zus&tzXiche 
Statusleitungen und/oder Handshakesignalen wie z. B. dem RDY/ACK Protokoll 
realisiert sein. 

.10. .. ■ 

SIMP Bus svst erne 

FUr einen effizienten Binsatz der von SIMD-Recbenwerken ist eine flexible und 
effiziente T]tosortierung der SZMD-WORD untereinander innerhalb eines Buisses 
Oder zwischen unterschiedlichen Buss en erf order lich. 

IS Die Busscbalter nach Figur llkOnnen derart modifiziert werden, daft eine 
flexible Verne tzung der einzelnen SIHD-WORD mSglich ist. Dazu warden die 
Busse Ober beispielsweise Multiplexer, Busscbalter, Transsiissiongates, P£iss- 
Transistoren (nachfolgend unter dem Begrif f Multiplexer zusannnengefaSt) 
entsprechend den Rechenwerken teilbar ausgelegt, derart daS durch 

20 Konfien^ration die Teiliong bestiinmt werden kann. Mit anderen Worten wird 

beispielsweise nicht ein Multiplexer der Breite m pro Bus verwendet, sondern 
n einzelne Multiplexer der Breite b » m/n, Es ist nunmehr nOglich, die 
Datezibusse fUr b bit Breite zu konf igurieren . Durch die Matrixstruktur der 
Busse (Figur 11) ist die XJtnsortierung der Daten ebenfalls in5glich, wie in 

25 Figur 12a dargestellt. 

Die Handshakes der Busse werden logisch derart verknt&pft, da& ein gemeinsamer 
Eemdshake fdr den neu geordneten Bus aus den Handshakes der ursprOnglicben 
Busse generiert wird. Beispielsweise kann ein RDY ftlr eineh neu sortierten 

30 Bus aus einer logischen UND-VerknUpfung aller RDYs der Daten fOr diesen Bus 
liefernden Busse generiert werden* Ebenso kann beispielsweise das ACK eines 
Daten liefernden Busses aus einer UND-Verknapfung der ACKs aller Basse 
generiert werden, die die Daten weiterverarbeiten. Prinzipiell sind bei der 
Xstplementierung geelgnete Verkntlpfvingen dergestalt zu wShl^r dass diese den. 

35 jeweils verwendeten Busprotokollen entsprechen. 

In einer ersten Ausfdhrungsvariante f inden die VerknO^fungen der Handshakes 
innerhalb eines jeden Busknotens statt. Dadurch wird es mOglich, einem 
Bussystem der Breite m, bestehend aus n Teilbussen der Breite b, bevorzugt 
40 nur ein Hand- shake-Protokoll zuzuordnen. 

In einer weiteren besonders bevorzugten Ausgestaltiuag werden s&ntliche 
Bussystexne in der Breite b ausgestaltet, die die kleinste realisierbaore Ein- 
/Ausgabe Datenbreite b eines SIMD-Word entspricht. Entsprechend der Breite 
45 der PAE Datenpfade <m) besteht nunmehr ein Bin*-/Ausgangsbu8 aus m/b » n 
Teilbussen der Breite b. Beispielsweise besitzt eine PAB mit 3 32bit 
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Elngangsbussen und 2 32 bit Ausgangsbusse bei einer kleinsten SIMIKWortbreite 
von 8 tatsachlich 3x4 8bit Bingangsbusse und 2x4 Bbit Ausgangsbusse. 
Jeder der Tellbusse weist bevprzugt sdmtliche verwendeten Handshake- imd 
Steuersignale au£, beispielswelse RSY/ACK tmd der Recdnfig-Trigger nach DE 
5 197 04 728.9 und ein globales Reset Signal, etc. 

Der Ausgang einer PAE versehdet bevorzugt dieselben Steuersignalen fttr 
samtliche n Teil-Busse. Bingehende Quittierungssignale aller Tellbusse werden 
bevorzugt miteinander logisch verloxUpft, z. B. durch eine X3ND-Punktion . Die 
Bussysteme k&nnen jeden. Teilbus f rei , verschalten und unabhSbigig routen. Die 
10 Bussysteme und insbesondere die Busknoten vereurbeiten und/ Oder verknfipfen die 
Handshake- Signed e der einzelnen Busse unabhSngig ihres Routings, ihrer 
Anordnung und Sortierung nicht. 

Bei in einer PAB eingehenden Daten werden die Steuersignale sdmtlicher n 
Tellbusse derart miteinander verkntipft, dass ein allgemeingUltiges 

15 Steuer signal quasi als Buss teuer signal ftlr den Datenpf ad generiert wird. 
Beispielswelse kOnnen in einer "dependend" Betriebsart RdyHold-Stufen tiXr 
jeden einzelnen Datenp£ad eingesetzt werden und erst, wenn sSmtliche RdyHold- 
Stufen anstehende Daten signal! sieren, werden diese von der PAE ISbemonmen. 
In einer "independend" Betriebsart werden die Daten jedes Teilbusses einzeln 

20 in Eingangsregister der PAE geschrieben und quittiert, wcxSlurch der Teilbus 
sofort fOr eine nachste DatenObertragung frei ist. Das Vorhandensein aller 
erforderlichen Daten von alien Tellbussen in den Bingangsregistem wird 
innerhalb der PAE durch geeignete logische Verkntlpfung der fOr jeden Teilbus 
im Eingangsregister gespeicherten RDY-Signale detektiert, woraufhin die PAB 

25 mit der Datenverarbeitung beginnt, 

Der wesentliche daraus resultierende Vorteil dieses Verf ahrens ist, dass die 
SI2!D-Eigenscha£t von PAEs keinerlei besonderen Einflufi auf das verwendete 
Bussystem aufweist. Bs werden lediglich mehr Busse (n) einer geringeren 
30 Breite (b) bendtigt. Die Verschaltung selbst bleibt unbertthrt. Die PAEs 
verknUpfen und verwalten die Steuerleitungen lokal. Dadurch entfailt der 
zusatzllche Hardwareauf wand in den Bussystanen zur Verwaltung tind/oder 
Verkntlpfung der Steuerleitungen. 

35 Figur 11 zeigt einen mOglichen und besonders bevorzugten Aufbau einer 

Busstruktur fUr VPU-Architekturen. pie Ausgabeschalt\uig einer Funktionszelle 
z. B, (PAE , FREO/BREO) <1103, entspricht 0803a,b) ist Ober einen vertikalen 
Bus mit dem horizontalen Bussystem {1102, entspricht 0105) verbunden. 
Entsprechend greifen die Eingabeschaltungen der Fuiiktionszellen (1101/ 

40 entspricht 0801, 0802) tkber einen vertilcalen Bus Infomationen von dem 

horizontalen Bussystem ab. In der Figur wird nunmehr verdeutlicht, wie ein 
derartiger Abgriff , bzw eine derartige Aufschaltung erfolgen kann. 
Wie in Fig. 11a dargestellt erfolgt das Aufschalten eines Ausgabebusses 
(1111) von 1103 auf 1102 durch ein •Auftrennen" eines Busses des horizontalen 

45 Bussystems 1102 \md das EinfQgen von horizontalen Schaltem (1112), die durch 
Switches, Transmission-Gates, Multiplexer oder ahnlichen geeigneten 
Bauelementen realisiert sein kttnnen. Abh£Uigig von dem Wert eines Dekoders 
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und/oder Konfigurationsblts (angedeutet durch das Schaltersynibol 1113), das 
entsprechehd der bekannten 

Konflgurationsregister der PAE angeordnet ist itnd konfiguriert wird, 
verbindet der Schaiter entweder 'die beiden Half ten dels borizontalen Busses 
5 1102 miteixiander oder schaltet den Bus 1111 au£ die eine H^f be von 1102 au£, 
die andere Half te von 1102 ist dann unterbrochen \xnd wird nicht 
weitergeleitet. Die Schaltimg wird bevorzugt fOr jeden Bus des horlzontalen 
BussysteiQS verwendet. 

Figur lib zeigt die entsprechende Schaltung zum Abgrif f von Daten yon 1102 

10 \md zur, Weiterleitung derer an 1101. Ober vertlkale Scbalter (1122) , die 
durch Switches, Transmission-Gates , Multiplexer oder ahnlichen geeigneten 
Bauelementen realisiert sein kennen, werden Daten bitweise von den Bussen des 
horizontalen Bussysteros (1102) abgegriffen und au£ den vertilcalen Eingangsbus 
(1121) zur Hingabeschciltimg 1101 Qbertragenw Die Ansteuerung der vertikalen 

15 Schaiter, d.h. ihre Schaltfunktion, erfolgt durch Dekoder und/ oder 
Konfigurationsbits (angedeutet durch die Sclialtersynlbole 1123), die 
entsprechend der bekannten Konfiguratlonsverfahren bevorzugt in 
Konfigurationsregistem der PAE angeordnet sind und konfiguriert werden. 
Fig. lib und bei entsprechender KodifiJcation auch Fig.. 11a lassen n:l 

20 DatenUbergcUige zu, d.h. mehrere Busse kOnnen zu einem Bus zusammengefaSt 
werden, d,h. die Daten nehrer Busse werden auf einem Bus zusammeagefUhrt. 
Fig. 11c zeigt die Busauf trennfvoiktion der horizontalen VFU-Bussysteme 
(1102) . OTeder horizon tale Bus einzeln vmd je ftlr sich kann an der 
Ausgabeseite der PAE-Kante aufgetrennt werden- Eine Auftrennung )cann durch 

25 l&iltiplexer oder Schaiter erfolgen^ wi^ in Figur 11c angedeutet werden soli. 
Je nach Konfigiirationsblt 1132, das bevorzugt fOr jeden Bus des Bussys terns je 
einzeln zur VerfOgung steht, wird die DatenObertragung auf das 
danebenliegende Bussys tern (1131) freigeschaltet oder unterbunden. 
Typischerweise wird diese Punktion in den Schaltem nach Figur 11a 

30 realisiert, indem die Information des Konf igurationsbits 1132 an die Schaiter 
(1112) des danebenliegenden Bussystems (1131) Obertragen wird und 
entsprechend die Schaiter zur Weiterleitung ermachtigt (enabled) oder die 
Schaiter sperrt (disabled) . . 

35 Figur 12a zeigt ein SIMD-Bus system entsprechend Figur 11. Dargestellt ist ein 
vereinfachtes horizontales Bussystem 1102, eine PAE Ausgabeschaltung 1103 und 
eine PAE Eingabeschaltung 1101. Jede Bingabeschalttmg weist beispielhaft 2 
Bingabebusse der Breite 32 bit auf (1201, 1202), jede Ausgabeschaltung 2 
entsprechende Ausgabebusse (1203, 1204). Jeder der Busse (1201, 1202, 1203, 

40 1204) ist in 4 Teilbusse zu je 8-bit aufgeteilt, die wie dargestellt jeweils 
unterschiedlich und unalshangig geroutet werden kOnnen, einige der Teilbusse 
werden niche verwendet (gepunktete Iiinie) . Die flexible Verschaltung wird 
dadurch erreicht, dass die Schaiter nach den Figuren lla-c ftlr jeden Bus 
derart getrennt aufgebaut sind, dass je ein Teilbus von einem Schaiter mit 

45 eigener Ronfiguration verwaltet* wird. Dadurch ist das Bussystem felngranular 
verscdialtbar. 



35 
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Figur 12b zeigt eine SIMD-Datenverarbeitimg, bei welcher samtliche Busse 
(1211) dasselbe Handshake (1212) aufweisen. Die Busse werden . innerhalb einer 
PAE in die Teilbusse getrennt Mnd in den SZMD-ALUs (1213, 1214} getrennt 
verarbeitet. Die gemeinsamen Hasidshakes steuern die\Ablau£steue3cung (1215) 
5. der PAEs an, bzw. werden von dieser generiert. 

Figur 12c zeigt eine SIMD-Datenverarbeitung, bei welcher sSmtliche Busse 
vollkonnaen getrennt sind (1221) getrennte Handshakes (1222) aufweisen. Die 
Busse in den. STm-MAJa (1223# 1224) getrennt verarbeitet. Die getrennten . 
10 Handshakes steuern die Ablaufsteuerung (1225) der PAEs an, bzw. werden. vozx 
dieser generiert. 



Einsatz von FPGAs als AliU-Core 
15 In PACTIB ist bereits eine Architektur beschrieben, in welcher anstatt einer 
ALU eine FPGA Oder FFGA-ahnliche Struktur in eine PAE integriert wlrd. Diese 
Struktur wird innerhalb einer PAE gemSLE den PPGA Konfigurationsmethoden nach 
dem Stand der Technik konfiguriert, d. h. die erweiterten 

Konfigurationsverfahren nach PACT02, 04, 05, 10, 13, 17 finden au£ die FPGA- 
20 Struktur keine Anwendung. Dadxirch sind Aufwand und Kosten fOr die 

Kon£ig\irationssteuerung der verbal tnisxo^ig kleinen FPGA-Zellen gering. Die 
PAE allerdings, die. die FPQA-Zellen enthait, verhait sich gemAS des VPO- 
Konfigurationsverfahrens nach den o. g. Schriften. Dadurch ist die FPGA- 
Struktur in der PAE-Struktur gekapselt und verbal t sich wie ein PAE-Objekt 
25 mit vielen Konfigurationsregistera. 

Dadurch lessen sich auch beliebige pperationen ai;f ein Array aus FPGTVs 
abbilden. GexnaS DB 101 35 210.7-53 ist eine Mischung aus ALU-PAEs und FPGA- 
PAEs innerhalb einer VP0 mOglich und durchaus sinnvoll . 

30 Es ist anhand des Anwendungsgebietes zu entscheiden, ob ein mehrfacher Satz 
an Konfigurationsregistem fOr die FFGA-Zellen sinnvoll ist, da deren Anzahl 

• •. sehr hoch ist. GegebeheiifcOL Is werden Kbnf iguratibnsregister zum schnellen 
Umkonfigurieren einer FPGA-PAE geinafi DE 196 51 075.9-53 , DE 199 26 538.0 
und insbesondere DE 100 28 397.7 Fig. 18 und 19 als Register-File oder FIFO- 

35 Struktur innerhalb der PAE realisiert und von dort aus in die FPOA-Zellen 
geladen • 

Es hat sich mittlerweile als besonders vorteilhaft berausgestellt, wenn 
innerhalb einer ALU-PAE eine FPGA Struktur der A1*U zugeordnet wird^ indem die 
40 FPGA-Struktur vor und/oder nach und/oder parallel zur ALU angeordnet wird. 
Bevorzugt ist eine Aus£tihrung in welcher die FPGA-Struktur der ALU 
nachgeschaltet wird. 

Der Vorteil liegt deurin, dass nur relativ kleine FP6A-Strukt\iren verwendet 
werden irtOssen, da samtliche arithmetischen Operationen weiterhin in der ALU 
45 ablaufen. Dadurch wird eine besonders hohe Kosten/Perforsiance E££izienz 

erreicht. um kleine Wortbreiten zu untersttttzen (4-bit, 8-bit, etc.), bietet 
es sich besonders an, die vorab beschriebenen SIMD-ALUs einziisetzen. 

36 
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Durch die Nachschaltung von FPGA-Strukturen hinter einer ALU lassen sich 
. insbesondere CbrreXatoren iind FNG-Generatoren be^bnder s e£fi zient aufbauen ... 

Der Einsatz von VPU Architektiiren bietet sich ndttlerweile' insbesondere fttr 
5 den Ersatz von ASICs bei mittleren und niederen Stackzahlen an. Dieses 
Einsatzgebiet der VFC7 Bausteine weist die Besonderheit auf , dass die 
Applikat ions f elder sehr klar definiert sind und haufig nur einige wenige 
i^plikationen au£ den Bausbeinen ausgefllhrt werden. Be senders diese 
Einsatzgebiete bendtigen hSlufig feingremulare FFGA-Strxikturen zur bitweisen 

10 Verarbeitung von Daten. 

Durch die Iiimitierxmg au£ wenige Anwendungen sind hier die mOglichen 
Konfigxirationen der FPGAs ebenfalls sehr begrenzt und vorhersagbar. 
£s vmrde erkannt, dass es beispielsweise insbesondere ftir diese 
Einsatzgebiete Xohnend ist, die Rekonfiguration der FPQA-Strukturen von der 

15 scfaneXlen Rekonfiguratioh der grobgranularen StruktTireh iabzuset:zten . kit 

anderen Worten werden fUr die FPGAs langsamere (z. B. herktimmliche serielle) 
Rekonfigurationsverfahren verwesidet^ die ^u&erst kosten- und flScheneffizient 
realisierbar sind. 

Dazu kann (1) ein vollkozomen separates Konfigurationssystem bestehend aus 
20 Bussystem imd Konf igurationskontrollem aufgebaut werden, wie dies von FPGAs 
nach dem Stand der Technik bekannt ist. (2) kfinnen die . 

Konf igurationsressourcen der VPU Technologie benutzt werden, ohne dass jedoch 
ResBOurce £Ur besondere beschleianigende Massnahmen zur Ver£0gimg gestellt 
werd^. Beispielsweise kann der Zugriff au£ den FILMO nacOi DE 196 54 593.5-53 

25 , DE 198 07 872.2 £Ur FPGA-Strukturen ausgeschlossen sein, ebenso wie das 

Vorbandensein von Konfigurationsregisters tacks nach DB.lOO 28 397*7 Oder wie 
nachfolgend beschrieben. Ebenfalls kann die Uhterstatzung der sdhnellen Wave- 
Rekonfiguration nach DE 199 26 538.0 , DE 100 28 397.7 entfallen. Es ist 
etwa mfiglich, einexn FFGA-Array eine PAE zur Umkonfigurierung zuzuordnen* Hier 

30 mul^ lediglicb die PAE dazu konfiguriert werden, die FPQ2l*Struktur zu laden, . 
was wie vorstehend beschreiben, dur<^ PAE-^gesteuerten, eigenst&odigen Zugriff 
auf X>aten von aulSen geschehen kann* 

Insbesondere bietet es sich aus Kost^gi^Undeh an anstatt der znehrfach 
rekonf ig\irierbaren Architekturen ressourcensparende "eimnal konfigurierlsMe' 

35 Architekturen einzusetzen. Die VPU-Bausteine werden dann einxnal vor ihrer 
Auslieferung aii den Kunden oder beim Kunden bzw. durcsh den Kunden 
personalisiert, d. h. die PPGA-Strukturen werden auf ihre durchzuftJhrende 
Fiuiktion konfiguriert. Die Funktion der FPGA-Strukturen ist sodann im 
weiteren unabanderlich, wShrend sSiatliche verbleibenden Funktionen^ wie die 

40 der ALUs und deren Vemetzung, weiterhin vollstandig laufzeitreJconfigurierbar 
entsprechend der VPU-Technologie ist 

Als "eimnal konfigurierbare" Technologien bieten sich besonders die be3cannten 
RDM, EPROM, EEPROH, FLASH basierenden Verfahren an. Es soil insbesondere 
erwclhnt sein, dass sich die bekannten Fuse und Antifuse-Verfahren (z.B. 
45 Atmel, Actel, Quicklogic) besonders zur Realisierung derartiger "eimnal 
programmierbarer" FPGA-Stsnikturen eignen. 
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Auf den prlnziplellen Aufbau derartiger Strukturen soli hier nicht welter 
eihgegangen warden, da dieser durch den einschiagigen istand der 
insl>esondere den Patenten der o. g. Firmen, hinreichend bekannt ist. 

5 Figxir 8 zeigt beisplelhaft eine erfindungsgemSLfie PAE. Dargestellt 1st der 
Datenpfad der PAE. Die Verblndung zu dem Bussystem 0105 wird durch die 
bevorzugt Register enthaltende Elngabeibaugruppe 0801 und 0802 und die 
ebenfalls bevorzugt Register enthaltende Ausgabebaugruppe 0803 read Islert. 

• Der ALU (0804) nachgeschaltet 1st elne Funktlonselnhelt aus felngranularen 
10 FPQA-ZelXen (0805), die Ober elnen Busstru)ctur mltelnander . verbunden slnd. . 

Der Ausgang von 0804 wlrd auf dlese Busstruktur aufgeschaltet, die 

• Busstruktur wlederum 1st mlt 0603 verschaltet. Optional und bevorzugt kann 
xnlttels elnes Multiplexers eln Qypass des Ausgangs von 0804 direkt au£ die 
Ausgal>ebaugruppe 0803 an 0805 vorbei geschaltet werden. 

15 In die FPGA-Zellen ktinnen mehrere Stufen Loglk konf Igurlert werden, 

lasbesondere s&ntllcbe oder elnlge der folgeziden Funktlonen: Multiplexer, 
AND, OK, XOR, NOT Funktlonen, Halb- addlerer, Verglelcher, Schlebereglster, 
Register, Boolsche Lookup-Tabellen. 

Die FFGA-Zellen (0805) kdnnen durch den Konflguratlonsbus (0404) der PAE 
20 konf igurlert werden. Bevorzugt werden besondere konf Iguratlonsbeschleunigende 

Baugruppen, wie z. B. Konf Iguratlonss tacks (0406) nicht zur Konf iguratlon von 

FPGA-Zellen benutzt. Dlese Baugruppen werden ggf • fOr derartlge 

Konf iguratlonsdaten passiv gescbaltet oder die Konf Iguratlonsdaten werden an 

Ihnen vorbeigeleltet. 
25 In einer besonderen Ausgestaltung 1st elne pexxnanente elnmallge Konflguratlon 

der PFGA-Zellen unter Verwendung von ROM-Elementen wie z. B. EPROM, EEPBOH, 

Flash-ROM Oder Fuse-ZAntlfuse-Technologlen vorgesehen. 

Flgtir 9 zeigt mOgllche erflndtingsgeiOclSe Ausgestaltungen von PAEs. Es soli 
30 ausdrUcklich darauf hlngewlesen werden, dass die Ausgestaltung in Figur 9a 
und die In Flgur 9b auch glelcdizeltlg ztisanmen In edlner PAE iinplementiert 
sein kdnnen., • . ' 

Figur 9a zeigt den Anschlui^ eines Registerflles (0901) (z.B. R0.«Rn) an einen 
35 Kern (0902), der beisplelsweise aus einer ALU wie 0804 oder einer ALCr (0804) 
und FPGA-Zellen (0805) bestehen kann. 

Die Brgebnisdaten des Kerns werden zu den Reglstem 0901 gefOhrt und dort je 
nach Operation elngespelchert . Die Register 0901 werden (tt>er Muliplexer 
(0903, 0904) je nach durcbzufObrenden Operation auf die EingSnge der. ALU 
40 geftShrt. 

Figur 9b zeigt eine ahnliche Struktur, bei welcher eine zvLBSitzliche 
Aufschalteinheit (0911) fOr einen dedizierten globalen Bus (0912) (z.B. 10- 
Channel) inplementiert ist. Die Ergebnisdaten des Kerns werden zu der 
45 Aufschalteeinheit 0911 geftlhrt und dort je nach Operation, auf den globalen 
dedizierten Bus (0912) ttbertragen. Fttr. die PAE bestimmte Daten von 0912 
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werden tlber Muliplexer (0903, 0904) je nach durchzuftShrenden Operation au£ 
die Eingaiige der ALU geifllhrt. 

Optional kann die Aufschalteeinheit 09X1 tU>er die Busaufschalteeinheiten 0913 
lind 0914 Daten dir^t von dem BiiissyBteia 0105 leseh oder au£ dieses 
5 Cbertragen. 

Figur 10a zeigt die Verwendung von dedizierten gXobalen Bussysteonen innerhalb 
eines Arrays aus PASs (1001) . Xnsoweit entspricht die DarstelXung des PAs aus 
Figur X (OXOX) . JeweiXs eine Menge von PAEs (XOOX) ist an die globaXen 

10 dedizierten Bussysteme .1002, 1003, 1004 angeschXoss^ und kann Daten au£ 
diese Senden oder von diesen E^fangen. Die Datentkbertragtmg kann sowohX 
zwischen den PABs, aXs auch zwischen PAEs \ind ZD Eftattfinden. Es ist . 
dargestelXt, dass PAEs audh an melirere gXobaXen dedizierten Busgysteme 
gleichzeitig angeschXossen sein kdniien, wShrend andere PABs mOgXicherweise 

15 keinen AnschXuss aufweisen; 

Figur XOb zeigt beispieXsweise den AnscbXuS eines gXdbaXen dedizierten Busses 
(beisplelsweise 1002 oder 1003 oder 1004), der innerhalb des Arrays aus PAEs 
(0101) mit einigen PAEs (1001) verbunden ist, an au&erhaXb des OXOX Xiegende, 
ggf • auch baixsteinexteme Baugnqppen. Die Baugruppen kfinnen beispieXsweise 

20 Peripherie (1011) und/oder Speicher (1012) sein. Zum AnschluE der auSerhalb 
liegenden Baugruppen (1011, 1012) kann ggf. eine Anpassung der SignaXe (z. B. 
Spannungen: CMOS, TTL, LVDS, etc.) stattfinden. 

Figur XOc zeigt ein BeispieX £Ur den AnschluE eines gXobaXen dedizierten 
25 Busses (beispieXsweise X002 oder X003 oder 1004} , der innerhaXb des Arrays 
aus PAEs (OXOX) mit einigen PAEs (XOOX) verbunden ist« an eine Interface- 
Baugruppe (X02X) . Die Interface-Baugruppe Hbersetzt die FrotokoXXe und/oder 
Signale des intemen dedizierten Busses au£ einen oder mehrere aufierhaXb 
Xiegenden Busse. In dem aiifgezeigten BeisipieX sind 2 aiiSeirhaXb Xiegezide Busse 
30 (X022, 1023) inipXementiert, Die Bussysteme sind bevorzugt unterschiedXicher 
AusgestaXtung, beispieXsweise kann X022 ein Speicherbussystem tilr Speicher 
(X024) vie SDR-RAHs, DDR-RAMS> . RANBUS o.cl. sein, wSlurend .X023 ein 
Peripheriebussystem fiix Peripherie- und/oder ZO-GerSlte (X025) darsteXXt, wie 
z. B. PCI Oder ein serieXXes ProtokoXX wie USB, FireWire, Ethernet. 

35 

Konf iquration komplexer Rechenwerke 

Koxi^Xexe Rechenwerke (z. B. Floating-Point Rechenwerke) kOnnen durch die 
geeignete VerschaXtung und Gnqppierung von konfigurierbaren ZeXXen (PABs) 
40 xn23gXicherweise auch unterschiedXic^er Batiart (RAH-PAEs, ALU-PABs, Bussen) 
reaXisiert werden. 

BeispieXsweise kann ein Floating-Point Rechenwerk durch eine geeignete 
Verschaltxmg von xnehreren ALU- PAEs, die die arithraetischien Operationen flber 
Exponent und Kantisse durchfdhren erreicht werden. Bevorzugt werden den ALU- 
45 PAEs die in der VPU des AnmeXders (XPP-TechnoXogie) integrierten Forward- wad 
Backward-Register (FREG/BREO) zugeordnet, um die notwendigen Normierungen 
durch Schiebeoperationen der in den FRE6/BRBQ angeordneten BarreX-Shifter 
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durchzuftihren. Damit lassen sich Floating-Point Rechenwerke bei Bedarf auf 
Basis der Integer-ALUs mit hoher Piachenef fizienz aufbM 

Bin VorteiX des Verfahrens liegt darin, dass keine Silizium-Fiache fOr fest 
iritegrierte Floating-Point Rechenwerke verwendet werden muss. Da Float ing- 
5 Point-Opera tionen relativ zu den Integer-Operationen nur selten gebraucht 
wird, steigt damit das Kosten/NUtzen-Verhaitnis erheblich an. 
Compiler, die Hochsprachenprpgramme auf eine VPO tibersetzen, kttnnen durch 
Kakroescpansion und/oder mittels Lauf zeit-Bibliotheken entsprechende 
vorgefertigte kon^lexe Strukturen in den M&schinencode (z, B. NML) 
10 Qbemehmen . 

FOr Haschinencode-Programne <z. B. NML) bieten sich besonders Library-C£ais 
auf Bibliotheken an, die die entsprechenden koiDplexen Funktionen vorgefertigt 
enthailten. 

15 

Stateinachines tiber RAM-PAEs 

Hit einem Array aus PAEs verbundene RAM-PAEs kOxmen zum Aufbau von Sequenzem 
eingesetzt werden. Das Gnmdprinzip bemiht darauf, dass Ausgangsdaten eines 
Speichers auf dessen Adresseingang zurackgekoppelt wird. Die Rttckkopplung 
20 erfolgt 3Devorzugt Ober ein taktgesteuertes Registers. Dadurch entsteht ein 
Sequenzer, dessen jeweils nachfolgender Zyklus durch den jeweils aktuellen 
Zyklus vorgegeben ist. 

Telle der Ausgangsdaten (Commoii-Signale) kOnnen nunmehr an andere Baugruppen 
und/oder Funktionszellen (PAEs) und/oder auch an exteme Oerate tkbertragen 

25 werden, um dort bestimmte Vorgange aoiszulfisen. Besonders bevorzugt sind zwei 
Ober tragungsar ten, die zumeist gemeinsam angewendet werden: 
a) die Obertragung Ober einen Datenbus, bevorzugt inbesondere als SIMD-Bus 
gemas der vorstehenden Erlauterung ausgestaltet, wodurcb eine teilweise 
Obertragung der Ausgangsdaten besonders effizient realisierbar ist. 

30 b) die tSbertragung Ober einen TriggerbuS/ dessen bevorzugte Ausgestaltung und 
Arbeitsweise in PACT08 beschrieben ist. Ober Triggerbusse )c<}nnen Zustande und 
Bedingungen zur Ablauf steuerung von Baugruppen und/oder Funktionszellen 
(PAEs) und/oder aucta extemen Geraten besonders ef£izient Obertragen werden. 

35 Der Aufbau der Eingangsadressen, bzw. Ausgangsdaten ist wie 
foXgt(Darstellung: hOherwertige Bits ... niederwertig Bits): 

Adresse : 



lAdresse des aktuellen Zyklus 



Da ten: 



40 



Adresse des nachsten Zyklus 



CONTROL- Signale 



Es bleibt zu erwShnen, dass die Eingangsdaten typischerweise nicht verwendet 
werden, d.h. auf den Speicher wird nur lesend# nicht schreibend zugegriffen. 
Der Xnhalt des Speichers (z.B. RAH-PAB) wird durch eine Konfigurationseinheit 
vorkonfiguriert. Deshcdb kann der Speicher insbesondere auCh als 
45 nichtf lOchtiger einmal prograiamierbarer Speicher mit ROM, EPROM, EEPROM, 

40 
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Flash Zellen oder basierend au£ Fuse Oder Antlfuse Technologien aufgebaut 
V sein/ Der Speicher wird berelts beschrieben, vor diar . . 

Auslleferung an den Kunden oder belia Kunden personalisiert« d.b. 
• progreuaaiaiert.-*- • 

5 

Bin Speicherzugriff durch andere PAEs ist grundsatzlich mSglich, urn den 
Sequenzer z.B. im Betrieb zu xaodiflzleren, soil aber au£gr<md des begrenzten 
Einsabzbereichs bier nicht weiter detailllert ausgeftOirt werden. 

10 Der erf indungsgexnaSe Sequenzer kann durch folgende Brweiterungen in seiner 

Abfolge von Zyklen auf Breignlsse reagieren und insbesondere bedingte SprUnge 
durchfOhren: 

Bin Teil, bevorzugt der niederwertige, der Eingangsadressen zu dem Speicher 
wird als Eingang fOr weltere Zustandssignale verwendet. Diese Zustandssigneile 

15 kbiuien durch die yorstehenden t^bertragungsarten Obertragen werden vaad sondt 
Daten oder Trigger sein. Bei der Selektion des nachfolgenden Zyklus wird 
nuninehr eine m6gliche Menge von Zyklen durch die DatenrQckkopplung auf die 
bevorzugt hohen Adressbits bestixnmt und der bestixmate Zyiaus wird dann aus 
der xoOglichen Menge durch die Zustandssignale auf den niederen Adressbits 

20 selektiert. 

Daraus resultiert folgender Aufbau der Eingangsadressen, bzw. Ausgangs daten 
wie folgt (Darstellung: hOherwertige Bits • . . niederwertig Bits) : 
Adresse: 

Zustandssignale 



25 



Adresse des 
aktuellen Zyklus 



Daten s 

[Adresse des nAchgten Zylclus [ CONTROL- Signale 

Sosiit ist ein vollwertiger Sequenzer definlert, der den Grundprinzipien der 
ifeaiiy-Moore Sequenzern'entepricht. 



30 



Die Zustandssignale und/oder Control-Signale kOnnen nunmehr ggf. zu Btindeln 
zusanmengefaSt derart gruppiert werden, dass je elne Gruppe bestixmaten 
Sendem/Empfangem zur VerfUgung steht, z.B. eine Grvq^pe fttr 0101-inteme 
PAEs und eine Gruppe fOr exteme Baugruppen und eine Gruppe zur 
35 Konf igurationseinheit . 



Mit anderen Worten werden samtliche SprQnge durch die Angabe der •Adresse des 
nachsten Zyklus" realisiert. Bedingungen werden durch die Zustandssignale 
realisiert. 

Das dabei auftretende Problem ist, wie sog. don*t cares, also bestixmate 
Zustandssignale, deren Wert zu einem ZykluB bedeutungslos ist, behandelt 
werden. Die bevorzugte Variante liegt darin, fOr samtliche mOglichen Werte 
dieselben Daten festziilegen. 
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15 



Beispiel: 

Innerlialb einer folgendesnnassen aufgebauten Adresse 



A^eBse des Zustaodsslgnale 
aktuellen Zyklus 

soli die -Adresse dee aktuellen zyklus" (Cycle) beispielhaft gleich 0x60, 
entsprechend CYCLE60 sein, Es slnd 4 Zustandsslgnale (ZS0..3) voxrgesehen, von 
denen innerhalb des belspielhaf te Zyklus' 2 (ZS3 und ZSl) je nach Wert zu 
anderen Sprungzielen fOhren,. also beispielhaft nach CYCIiElO, CYCLE?, CYCLESS, 
CYCItESe. 

Die Tabelle sieht nunmehr vie folgt aus: 



Adresse 


Daten 


Cycle 


ZS3 


ZS2 


ZSl 


ZSO 




CYCLESO 


0 


7 


0 


? 


CYCLEIO 


CYCLEeO 


0 


? 


1 


? 


CYCLE? 


CyCLE60 


1 


? 


0 


? 


CYCLES 9 


CyCLE60 


1 


? 


1 


? 


CYCLES 6 


Die don't cares (ZS2, ZSO) werden nunmehr so 1 
Signales keinen Einflufi auf die Zuordnung der 


Adresse 


Daten 


Cycle 


ZS3 


ZS2 


ZSl 


ZSO 




CYCI1E6O 


0 


0 


0 


0 


CYCLEIO 


CYCLE60 


0 


0 


0 


1 


CYCLEIO 


CYCI1E6O 


0 


0 


1 


0 


CYCLE? 


CYCI1B6O 


0 


0 


1 


1 


CYCLE? 


CYCLB60 


1 


0 


0 


0 


CYCLE89 


CYCLE60 


1 


0 


0 


1 


CYCLE89 


CYCLB60 


1 


0 


1 


0. 


CYCLE56 


CYCLB60 


1 


0 


1 


1 


CYCLE56 


CYCLE60 


0 


1 


0 


0 


CYCLEIO 


CYCLE60 


0 


1 


0 


1 


CYCLEIO 


CYCLEeO 


0 


1 


1 


0 


CYCLE? 


CYCLES 0 


0 


1 


1 


1 


CYCLE? 


CYCLE60 


1 


1 


0 


0 


CYCLE89 


CYCLE60 


1 


1 


0 


1 


CYCLES 9 


CYCLE60 


1 


1 


1 


0 


CYCLES 6 


CYCLB60 


1 


1 


1 


1 


CYCLE56 



jeder Zielzyklus ist mmmehr 4-fach gespeichert, entsprechend alien binteen 
Konbinationsznaglichkeiten der don't care. 



Eine weitere optionale/ aber sinnvolle und daher bevorzugte 
20 AusaestoltungsmOglichkeit des Sequenzers sieht einen zusAtzlichen Teilbereich 
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der Ausgangsdaten ffb: eine Selektor<- und/oder Verglelchsmaske £tlr die 
Zustandissignale vorl Bei der Verwendung als Selektor kOnnen z.B. durcli die 
Ansteuerung von Multiplexern durch die Selektormaske edlne Teilmenge von 
Zustandssignalen atxs mehreren mdglichen ausgewdhlt werden. Die zus^tzliche 
optionale Vergleichsmaske kann als Vergleichsoperator fUr einen Vergleicher 
dienen, der entsprechend ein Statusbit (gleich/nicht gleich) aus einer Henge 
von Statusbits generiert. Ebenfalls Icann die Vergleichsmaske zur Deselekbion 
von don't care Signal en dienen, z.B. fiber eine normale Maskenoperation durch 
Verundung nach dem Stand der Tecbnik (siehe PACTIO) .... 

Der Aufbau der Ausgabedaten ist daxin wie folgt: 

Dat^: 



Adresse des nSLchsten 
Zyklus 



CONTROL- Signale 



Selektor /Vergleichsmeusl^ 



15 

Ein bevorzugter Seguenzer kann beispielsweise wie folgt aufgebaut sein: 
Der Adressbus einer RAH-PAE, die als Seqpjenzerspeicher verwendet wird, wird 
in mehrere Teiladressen beliebiger und insbesondere mSglicherweise auch 
xinterschiedlicher Breite aufgeteilt, beispielsweise Bit 0.*3 fOr eine erste 
20 Teiladresse (ITEXT.CYCIiE) , Bit 4.. 7 ftir eine zweite Teiladresse und 
Bit 8.. 12 ftir eine dritte Teiladresse {CTRL_IN) . 

Der Datenausgang einer RAM<~PAE wird in mehrere Teildaten beliebiger und 
insbesondere m^licherweise auch unterschiedlicher Breite aufgeteilt, 
beispielsweise Bit 0..3 ftir die ersten Teildaten (CYLCE) , Bit 4.. 7 ftir die 
25 zweiten Teildaten (SEQ^OOT) imd Bit 8.. 12 ftir die dritten Teildaten 
(CTOLrjODT) . 

Zur Auf teilitng der Adressen und/oder Daten kann insbesondere das beschriebene 
SIMD PAB- und Bus-Konzept verwendet werden. Weiterhin kann die Au£treimung 
30 innerhalb der RAM-PAB ierfolgeh* 

Der RAM-FAE k5nnen datenverarbeitende PAEs zugeordnet werden, wie z* B. ALU- 
PABs. 



35 Die Festlegung des nSlchsten Zyklusses innerhalb eines Sequenzerdurchlaufs 
erfolgt durch die RQckkopplimg von NEXT^CYCLE auf CYCZiE* 



In einer erweiterten Ausfflhrungsvariante kOnnen zusAtzliche 
datenverarbeitende PAEs zur Berechnung von CYCI*E in AbhSngigkeit von 
40 NEXTjCYCLE innerhalb der RQckkopplung vorgesehen sein. Diese PAEs kOnnen auf 
belieblge, insbesondere auch zus£ltzliche Signale, Daten oder Zustdnde 
anderer PAEs und/oder extemer/ peripherer Baugruppen reagieren. Desweiteraot 
k6nnen diese PAEs zus^tzliche Signale oder Daten erzeugen. 
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Zur Realisierung einee erweiterten Sequenzers kfinnen weitere PAEs angekoppelt 
eein, die in einer inaglichen Ausgestaltimg auch in ihrer Punkt i on ixnd/oder- 
Vemetziang vom Sequenzer beeinflufit werden kQnnen. Dazn kazm der Sequenzer 
bateh ill die KohfigufationBregieter der entsprechendeti PAJSs flbertragen. Ein 
5 Zugriff auf die Konfig\xrationsr agister kann beispielsweise durch die in DE 
197 04 728.9 bescbrieldene Architektur erfolgen <vgl. DB 197 04 728. 9 1 Fig. 
4) . Die angekoppelten PAEs verarbeiten vorwiegend Da ten beliebiger Art und 
besitzen Anschlufi an weitere PAEs, insbesondere datenverarbeitende (ALU-PABs) 
und/oder Speicher-PAEs (RAM-PAEs) und/oder periphere AnscblUsse (lO-PAEs) . 
.10 . Diese PAEs kdnnen durch die durch SEQ_O0T dargestellten Control-Signale. 
angesteuert werden und kdnnen bedarfswelse durch die an SEQL.ZN geleiteten 
Zustandssignale Ablauf speicher d.es Sequenzers ansteuem. 

15 Weitere mSglicherweise auch unabhangige PAEs oder Eiziheiten, insbesondere 

auch exteme/periphere Eixiheiten und/oder Obergeordnete CTs kSnnen durch den 
Sequenzerspeicher entsprechend SBQL.IN/OUT angesteuert werden (CTRL.onT) oder 
diesen ansteuem (CTRL^IN) • 

20 

Zur korrekten taktgesteuerten Ablauf steuerung des Sequenzers sind in 
RQckkoppltmgspfade bevorzugt taktsynchronisierte Register eingebaut. 

Die RAM-PAE kaxin durch eine ttbergeordnete Konfigurationseinheit konfiguriert 
25 werden, insbesondere kdnnen die Sequenzerfunktionen durch den Tnhalt der RAM- 
PAB konfiguriert und festgelegt werden. 

Es wurde als vorteilhaft erkannt und wird fUr sich ala patentfdhig gehalten, 
dass init einem Speicher ein einfacher Sequenzer ohne grofien zusatzlichen 

30 Hardwareaufwand realisiert wird. Dies ist besonders leicht dadurch mOglich, 
dass zun^Ldhst der Inhalt einer Speicherzelle dahingehend ausgewertet wird, an 
. welcher Stelle als nachstes eih Iiesezugrif f erfolgen soil. Wenn dor t wieder 
angegeben ist, wo als nachstes ein Zugriff erfolgt, ist ein autcHnatenartiges 
Durchlaufen realisierbar. Zugleich wiana aber gemafi der hier als vorteilhaft 

35 erlcannten Ausgestaltung nicht einfach eine weitere Adresse fttr den nachsten 
Zugriff ermittelt, sondem parallel dazu angegeben, was dabei zu tun ist; ndt 
anderen worten werden an der Speicheradresse auch Daten oder Bef ehle 
mitabgespeichert. Dies kann dadurch geschehen, dass ein Teil der an einer 
Stelle gespeicherten Infoxxnation die Adresse fUr den nachsten Zugriff angibt 

40 und ein weitere Teil einen Befehl oder Daten darstellt. Dies ist ohne 

weiteres mOglich, wenii die Breite der gespeicherten Daten auf geteilt wird in 
einen Adressanteil und einen Daten/Bef ehlsanteil* Weiter ist es sogar 
laOglich, nur einen Teil der im Speicher adressierbaren Speicherpiatze zu 
kodieren, etwa bei 12 bit Breite nur 8 bit zu verwenden. Dann kOnnen weitere 

45 Bits hinzugefUgt werden, hier vier, etwa durch Auswertimg von Flags, 

Triggem, Zustanden, tJberiaufen etc. Dies hat den Vorteil, dass an die 
Speicherstellen, die dann exakt angesprochen werden durch Vorgabe der hier 
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Sbltlgen ausgelesenen Adresse tmd der hier 4bit auswertegenerierten 
Informatloh, unterschledliche Ahwelsiingen gesetzt werden kdnnen. Es sei 
darauf hingewiesen, ■ dass eitweder alle Trigger iind die erf orderliche Reaktion 
hierau£ von vomeherein festlegbar sihd oder dass altemativ auch zuaiindest 
5 Telle der Reaktionen au£ einzelne oder alle Trigger wShrend der AusfOhruzig 
einer Konf iguration variiert und/oder festgelegt werden kOnnen. Hierzu kann 
eine Rtlckkopplung au£ eine Triggexmaskierung usw. vorge^ehen sein. 

Dies erlavibt es, abhSngig von den ausgewerteten Informationen bedingte 
10 SprOnge etc. zu generieren. Sind dabei yon einer Reihe per- se axiswertbarer 
Informationen nur wenige interessant, werden also aktuell im obigen Beispiel 
etwa nur 2 statt vier Bits benOtigt, so kaxm die jeweils in einer 
entsprechenden Speichers telle angegebene Xnforznation an jenen. Speicherstellen 
auch vorhanden sein, die sic^ nur urn nicht interessieren^ Bits in ihrer 
15 Adresse unterscheiden . 

Figur 15 zeigt ein Ausgestaltungsbeispiel eines erf indungsgemcU&en Sequenzers 
basierend auf einer RAM-PAE. Ein Teil (1505) des Datenausgangs <1502) eines 
Speichers (1501) ist tSber ein taktgesteuertes Register (1503) auf den 
20 Adresseingang (1504) des Speichers zurdckgekoppelt . Der Adresseingang (1504) 
entspricht somit CYCLB und 1505 einem Teil, bevorzugt dem HOherwertigen, von 
NEXTjCYCIiE. 

Optional kann ein Teil (1508) des Datenausgangs (1502) an eine Selektor- 
25 Naskeneinheit (1509> 1510) geftShrt werden, in welcher die vom Bus system 0105 
als Da ten tmd/ oder Trigger eingehenden SBCLJN (1511) bzw. CTRI^_JN (1512) 
Da ten ver2u:beitet werden* 

CTRL_iN und SBCL-IN und/ Oder der en in der Selektor-Maskeneinheit vereurbeitete 
30 Werte werden zu 1505 dazugemischt (1513) , bevorzugt derart, dass 1505 den 
hOherwertigen Adressteil und CTRIc.XN/SEQ_IN den: niederwertigen bilden. 

Der verbleil>ende Teil des . Datenausgangs (1502) kann in einen SBQlPOT- (1506) 
und GTRIijODT (1507) Teil aufgetrennt werden und.tlber die Ausgabebaugruppen 
35 0803a,b als Daten \md/oder Trigger auf das Bussystem 0105 geflUirt. 

Verschiedene Konf igurationsregistermodelle zur Festlegung der Konfigvuration 
von jeweils lokal zugeordneten PAEs sind bekannt. In PACT02 ist ein 
sequentiell abarbeitbares Modell beschrleben, in PACT04 ist ein FIFO-MOdell 
40 beschrieben, das ebenfalls sequentiell abgearbeitet und Oberlappend 

konfiguriert werden kann, in PACT08 ist ein selektives Modell Iseschrieben, 
bei welchem abhtogig von der Datenverarbeitung bestimmte 

Konfigurationsregister und danit die in ihnen gespeidherte Funktion und/oder 
Vernetzung ausgew^hlt werden. In DE 100 28 397.7 ist weiterhin ein FIFO- 
45 Hodell beschrieben, das sich besonders ftir die Vorabkonfiguration und 
tlberlappende Konf iguration eignet. 
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Als besonders leistungsfahig und Kosten/Perfozinance effizlent wurde eine 
Hischung aus diesen Hbdeilen erkaxint. 

Das FIPO-MbdeXl nach DB XOO 28 397.7 eignet sich besonders, urn elne ' 
5 beliebige Anzahl von Konf igurationsregistem von PAEs vorzuladen, da die. 
Funktion des verwendeten FIFOs eine variable Konfigurationsiange effizient 
ermfiglicht. Hierzu wird jeder PAE ein lolcaler FXFO-Speicber zugeoirdnetr der 
die Konfigurationen seiner zugeordneten PAE verwaltet und pu£fert. 

10 Durcb eine Erweiterung, wie z. B. die nachfolgend beschriebene, des FIFO- 

Modelles kann der Anfang und das Ende einer bestimraten Konfiguration und der 
dazugehdrenden einzelnen Konfigurationseintr^ge festgestellt werden. NUnmehr 
k6nnen mehrere Konfigurationen zugleich in dem FIF0-M6dell abgelegt werden. 

15 Als besonders geeignet zur Kennzeichnung des Anf angs oder Bndes von 

Konfigurationen haben sich die zwei nachf olgend beschriebenen Verfahren 
herausgestellt : 

a) Kennzeichnung durch zusatzliche Bits (CycleBits) in jeder Speicherzellet 
20 CTedem Konfigurationseintrag werden zusStzliche Bits zugeordnet, die den 
Beginn und/oder das Ende einer Konf igurat ion kennzeichnen. Beispielsweise 

kann ein Eintrag im FIFO wie folgt aussehen: 



Bit 0..15 


Bit 16 


Bit 17 


Konf igurationswor t 


O=don* t 

care 

IsBeginn 


O=don*t 

Ccure 

laBnde 


Da bevorzugt nach dem nacShf olgend beschriebenen Verfahren direkt auf den 
Beginn von Konfigurationen gezeigt werden kann, wird bevorzugt auf die 
Anzeige des Beginns verzichtet: 


Bit 0. .15 


Bit 16 




Konfigurationswort 


O=don't 

care 

l=Ende 





b) Besonders effizient kann die Kennzeichnung durch besondere 
Konfigurationsworte sein, die als Bef^e dekodiert werden: 
30 Bestinimte Bitkoinbinationen innerhalb des Konfigurationswortes werden als 
BeCehle dekodiert und erkannt: 

Beispielsweise kOnnten die folgenden Befehle inplexnentiert sein: 
BEGIN : Beginn einer Konfiguration 
END : Ende einer Konfiguration 
35 Dieses Verfahren ist erheblicb flexibler und leistungsfahiger als die 
Kennzeichnung durch CycleBits. 
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Zur einfachen lAiterscheidxing von Bef ehlen \ind K6n£lgurationen kann IQmlich 
den CycleBits ein Bit vorgesehen seln> das dvirch seinen Wert die Semantik der 
Konflgurationswprtes bestixmnt, beispielsweise vie folgt: 



Bit' 0.-.15-- 


Bit 16 


Daten 


O=lnterpretation der Daten als 




Konfigtirationswort 




Issinterpretation der Daten als 




Befehl 



5 Bine Konf iguration wird je Aufruf von ihrem ftnfang bis zu ilireia Ende in die 
Konfigurationsregister einer PAE fiber tragen. 

Durch eine pptionale zusatzlicbe Obersetzungs** und Zuweisungsvorrichtung 

kdixnen Zusti^de (z.B. ZuetSnde der eigeneh ALU und/oder ein oder inehrere 
10 Trigger (vgl. DE 197 04 728.9 ) beispielsweise anderer CAEs) au£ bestimmte 
Konfigurationen innerbalb des FIFO-Mddells tXbersetzt werden. Beispielsweise 
kann ein ein tref fender Rekonfigurations trigger auf eine bestinmte 
Xonf iguration innerhalb des FIFO-Modells zeigen, die durch das Auftreten des 
Rekonfigurationstrigger dann kon£iguriert wird. 

15 

Als Obersetzungs-* und Zuweisungsvorricbttmg kdnnen beispielsweise 
algebraische Bereclsnungen und/oder logische Verkntlpfungen und/oder bevorzugt 
Obersetzungsspeicher (l»ookup-Tabellen) zum Einsatz konunen. 

20 Wenn verschiedene Konfigurationen in einer Oder ftlr eine oder eine Reibe von 
FABs abgelegt werden, so bietet es sich an, die Adressen, an denen die 
jeweilige Infozioation abgelegt ist, auf einfache Weise dadurcb zu verwalten, 
dass die hScag&a der jeweiligen abgespeicherten Konfigurationen aufaddiert 
werden. Dies ist dann wichtig, wenn die Konfigurationen unterschiedliche 

25 Iidngen haben, etwa weil bei bestinmten Konfigurationen Busse und/oder 

Register, wie Vorwarts- und Rtlbkwartsregister konf iguriert werden massen und 
. bei ahdere nur neue Fxmktioneii der ALU einer fae einzustell^ sind, oder weil 
gleichzeitig Konfigurationsinfoxnation fOr zellexterne Binheiten mitverwaltet 

30 

Es ist damit also zn&glich, einen Quasi -Fifocharakter zu ixnplementieren . Dann 
sollten Uittel zum Aufaddieren, insbesondere sukzessivem Aufaddieren von 
Konfigurationsltogen, sowie daftlr, bei Oberfltlssigwerden bestiinmter 
Konfigurationen, etwa aufgrund von Abarbeitung etc., die betreffenden 
35 Bereidhe freizug^ben. Das Aufaddieren ist etwa problemfrei mit Addiererketten 
nfiglic^. 

Diese Anordnung kann verwendet werden, um in einer Zelle Konfigurationen zu 
verwalten bzw. wiederum einen Sequenzer zu iii5>lementieren . Wiederum kann so 
40 auf die Konfigurationen reagiert werden, dass sich Sprtinge etc realisieren 
lassen. Es sei darauf hingewiesen, dass oben bereits erwSbnt wurde, dass zur 
Realisierung von Seguenzem zwischen ALlT-PABs und/oder anderen 
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datemrerarbeitenden Zellen mit jeweils gegebenenfalls erwelterter 
FunJctionalitat und Speicherzellaa Steuer.(Ccnm«nd-)Leituagai vorgese^ *. 
kfixmen. Es sei erwShnt, dass derartlge Leltungen sdt zugeordeten Steuerungen 
auch Izmerhalb elner einzeinen. \md fOr sich autark seqeunzerfShigen PAE 
S vorgesehen sein kdiinen. 

Eine besonders bevorzugte Variante ist in Figur 14 dargestellt und eurbeitet 
wie.folgt: 

10 Bine Kette von Addierem wird derart miteinander verbunden, dass das Ergebnis 
(SUMMB) eines vorherigen Addierers (p) an einen nachfolgenden Addlerer (p+1) 
als Operand weitergeleitet wl3^. Die Weiterleitung kaim derart unterbrochen 
werden* dass anstatt des Ergebnisses eine 0 (Null) weitergeleitet wird. 
Als zweiter operand ist jedem Addierer jeweils ein eigenes Registers 

15 zugeordnet, dessen Wert jeweils zur STOSME der vorherigen Stufen addierb wird. 
Jede der Stufen reprasentiert eine Konf iguration im Konfigurations-PIFO; in 
dem Register der jeweiligen Stufe ist die relative Stcirtposition einer 
Konf iguration gespeichert. Die absolute Startpositlon lafit sich nnn 
berechnen, indem samtliche relative Steortpositionen der sich unterhalb im 

20 FIFO befindenden Konfigurationen aufaddiert werden. Dies geschieht dnrch die 
Addiererketten^ wie auch aus der Fig. Ersichtlich ist. 

Mit anderen Worten ist die relative Position als unterste Konfigurabion im 
FIFO diejenige, deren Eintrag am Nftchsten zum Ergelsnisausgang der 
25 Addiererkette gespeichert ist. Sodann folgen alle weiteren relativen 
Positionen gemSLS ihrer Anordnuag im FIFO. 

Die Kette wird an der Stelle durch einschleusen einer Null anstelle der SUtsm 
unterbrochen, bel welcher die relative Position der selektierten 
30 Konfigurabion erreicht ist. 

Das Ergebnis ist nunmehr der Offset zwischen dem r*esepointer des FIFOs, der 
auf die tinterste Konf iguration zeigt, und der Startposition der selektierten 
Konfigurabion. 

Somit ist die Spnangadresse zxir selektierten Konfiguration einfach durch 
35 Addition von Zeiger und Offset berechenbar. 

Die Auswahl der selektierten Konfiguration kann durch unterschiedliche 
Verfahren in der Obersetzungs- und Zuweisungseinrichtung erfolgen. 
(a) Die eingehenden Trigger kOnnen priorisiert und dekodiert werden. 
40 {b> Die eingehenden Trigger werden tiber eine I^ookup-Tabelle tlbersetzt und 
danach m&glicheirweise priorisierb und dekodierb. 
(c) Ks der Uenge aller Trigger werden einige axusgewShlb, z.B. COoer 
Hulbiplexer, die sodann enbsprechend (a,b) weiberverarbeiteb werden. 

45 Es soli besonders darauf hingewiesen werden, dass ein Trigger auch ein Vekbor 

(TRIG-V) sein kann, wie in PACT08 beschrieben. Der Vekbor selbst kaim zur 
weiteren Dekodierung verwendet werden, d.h. der Vektor selektiert die 

48 



wo 03/036507 



PCT/EP02/10572 



Konf iguration. Dies ist Insbesondere daim wichtig, werm eine Wave- 
Rekonflgtiraitlon nach PACTOS, PACTia, PACT17 durchgef tihrt werden soil, bei 
welcher bevorzugt ein mit den Daten tibertragener Trigger-Vektor die n^chste 
Konf iguration selektiert. 

5 

Nach Oder wShrend der Konfiguration kOnnen Konfiguratlonen aus dem FIFO 
entfemt werden. Bevorzugt wird dabei die Referenzierung innerhalb der 
tibersetzungs- xind Zuweisungsvorrichtung entsprechend angepasst. 

Weiterhin Jcann das FIPO-Modell urn das Sequenzer-Verfahren nach DE 196 54 
846.2-53 (bzw, wie bei den anderen Schutzrechten, ohne separat erwShnt zu 
sein, deren pualXele) oder bevorzugt das vorstehend besciiriebene erweitert 
werden V Dazu werden bei spiel sweise Sprtinge (GOTO) , sowie zustandsabhSngige 
15 und bedingte SprOnge (WAIT-GOTO, IF-GOTO) eingeftihrt, Sprtinge k6nnen duirch 
besondere CycleBits repr&sentiert werden, oder bevorzugt als Be£ehle 
inplenentiert sein. 

Weiterhin kann ein Synchronisationsanzeigeverfahren verwendet werden, das 
20 anzeigt, wann eine bestimmte Konfiguration bzw. ein bestimmter Zyklus des 
Sequenzers beendet ist. Mit anderen Worten Icann jeder Zyklus aus mehreren 
Konfigurationseintrftgen bestehen. Zur Kennzeichnung Icann beispieXsweise nach 
DE 196 54 846.2-53 ein run/stop-Flag verwendet werden, wobei 'run' 
zusassnengehdrende KonfigurationseintrSge eines Zyklus kennzeichnet imd *stpp* 
25 den ersten Eintrag eines nachfolgenden Zylclus; altemativ ist ist die 

Verwendung der vorstehend beschriebenen CycleBits mOglich, die zwar eine 
etwas andere Semantik aufweisen, sich aber ansonst glelch verbal ten. 

iaternativ oder zusatzlich zu diesen Verfahren kfinnen auch die ebenfalls aus 
30 den frOheren Anmeldungen des Anmelders bekannten Bef ehle WAIT uxid BE6XN oder 
bevorzugt die vorstehend besdbriebenen Befehle BB3IN und END verwendet 
werden, 

Durch ^8top* Oder WAIT oder END wird das Bnde eines Zyklus. gekezinzeichhetr d. 
h. eine Konfiguration ist koir5)lett, kann ausgefOhrt und abgearbeitet werden, 
35 Hach Beendigung der Datenverarbeitiing dieser Konfiguration wird der ndchste 
Zyklus ausgeftlhrt. 

Die Beendigung kann entsprechend sequentieller Prozessoren durch einen Takt 
(Instruktionssequenzing) definiert sein, und/oder entsprechend des 
40 Datenverarbeitungspriuzips der PACT-Prozessoren (P 44 16 881.0-53 , DE 196 54 
846.2-53 , Konfigurationssequenzing) durch ein Statussignal (z. B, einen 
Trigger) definiert sein. 

Mit anderen Worten wird z.B. kann durch das Bintreffen eines Triggers 'stop'. 
45 Obersprungen werden und die nachfolgenden Konfiguratlonen konfiguriert 

werden. Altemativ oder ziisatzlich kann der Befehl WAIT eingesetzt werden, 
der auf das Eintreffen eines Triggers. 
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Optional Jcann ein FIFO nlclit nur die lokal zugeordnete PAE ansteuern, sondem 
auch weitere, insbesondere xnnliegeade pder . zur . selben Kon£iguration gehOrende 
PAEs."- 

5 

Optional kazm der FIFO auch als eine dedizierte Einheit nach DE 196 54 846.2- 
53 ausgestaltet sein. 

AusffUinmgsbei spiel e : 
10 A) Ein eintr offender Trigger wird fiber eine tibersetzungs- imd 

Zuweisungsvorrichtung auf eine im FIFO liegende Konfiguration (Tl) tibersetzt. 

Die Konfiguration (Kl) wird daraufhin in die PAB konfiguriert. Als Ende-r 

Kennung Icann beispielsweise ein WAXT-Befehl, ein END-Bef^l oder das 

run/stop-Plag dienen. 
15 Ein nachfolgend eintref fender Trigger wird iXber eine Obersetzxmgs- und 

ZuweisungsvorrichtTjng auf eine andere im FIFO liegende Konfiguration (K2) 

tibersetzt. Diese Konfiguration (K2) wird daraufhin in die PAE konf iguriert . 

XI und/ Oder K2 kdnnen nach erfolgter Konfiguration in die PAE aus dem FIFO 

gelOscht werden; 

20 

B) Ein eintref fender Trigger wird fiber eine Obersetzungs- und 
Zuweisungsvorrichtung auf eine im FIFO liegende Konfiguration <K3} fibersetzt, 
die aus mehreren Zyklen (Cyl, Cy2, CySa, Cy3b, Cy4) besteht. Der erste Zyklus 
(Cyl) wird daraufhin in die PAB konf iguriert und ausgeftttirt. Als Ende-Kennung 

25 kann beispielsweise ein WAIT-Befehl oder das run/ stop-Flag dienen. 

Ein nachfolgend eintref fender Trigger, der das Ausftthrungsende des Zyklus 
anzeigt, bewirkt die Konfiguration und das Ausftlhren von Cy2, Cy2 endet mit 
zwei WAIT-OOTO-Befehlen (WAIT-GOTO (Trgl, Cy3a) ; WAIT-GOTO (Trg2, Cy3b)) 
(vgl, PACT04), dies bewirkt, dass auf zwei unterschiedllche Trigger, die das 

30 Ausftlhrungsende des Zyklus anzeigen, Trgl und Trg2 reagiert wird. Trifft Trgl 
ein, wird im nachsten .Zylclus Cy3a konf iguriert und ausgefUhrt bzw. bei Trg2 
entsprechend Cy3b. 

cy3a und Cy3b enden mit einem WAITtGOTO (Trg, Cy4) . Bei eintref fen eines 
35 Trigger, der das Ausftlhrungsende des Zyklus anzeigt, wird nach Cy4 gesprungen 
und die Konfiguration entsprechend konfiguriert und ausgeftlhrt. 

Cy4 endet mit einem WAIT-GOTO (Trg, Cyl), wodurch bei eintref fen des Trigger, 
der das AusfOhrungsende des Zyklus anzeigt, der emeute sequentielle 
40 Durchlauf einer Schleife beginnen kann. Xnsoweit kann durch den Sprung auf 
Cyl ein Ringspeicher nach DE 196 54 846.2-53 zum AusfOhren von Schleifen 
gebildet werden, wobei solch ein Ringspeicher vorteilhaf tt aber nicht 
zwingend ist. 



45 Durch Eintreffen eines Triggers (Trg-x) kann die Schleife tezminiert werden. 
Bxistiert ein Eintrag ftlr Trg-x in der Obersetziings- und 

Zuweisungsvorrichtung kann die Schleife jederzeit abgebrochen und die durch 
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Trg-x in der Obersetzungs- und; Zuwelsungsvorrichtung re£erenzierte 

Konfiguratlon (KX) ausgefOhrt werden. 

Bxistiert kein Eintrag, kaim durch das explizite Verwenden von WAXT-GOTO 
(Trg-x, KX) Befehlen, z.B. zuiBaBsnen mlt WAIT-(30TO (Trg> Cyi) in Cy4 die 
5 Schleife zu bestimmte vorgegebenen Ausftttirungszeitpunkten tezminiert werden. 

Figur 13 zeigt beispielhaft einen Aufbau eines Konfigurationsbusses zur 
Konfiguration von PAEs (1001) durch eine Konf igxirationseinheit (0106). Die 
Konfigurationseix)heit sendet Konfigurationsdaten iXber ein Bussysten 1301 und 

10. gg£. Ober niehrere Registerstu£en (1303, 1304) zvur Verbesseaning des . 

Frequenzverhaltens und tlber den Konfigurationsdatenbus (0404) an die PAEs 
1001. Jede PAE dekodiert die angelegten Adressen tand reagiert, sofem sie 
selektiert wurde, auf die DatentUberbragimg des Busses. PAEs kOnnen ibrerseits 
Daten ttber 0404 Ober die Register-Multiplexer-Stufen 1304 auf das Bussystem 

15 aufschalten und die Kbnfigurationseinheit oder optional andere PAEs senden. 
Dies geschieht jeweils durch tJbertragving der Adr^se der Eaip£euigseinheit. 
Die RQckObertragung der Daten an die Konfigurationseinheit erfolgt bevorzugt 
ebenfalls duxch Regis terstufen hindurch (1305), bis zum Dateneingangsbus der 
Konfigurationseinheit (1302) . 

20 Die Punktionsweise des Konfigturationsbusses ist ebenfalls in DE 101 42 904.5 
und DE 100 28 397.7 beschrieben, die zu Of fenbarungszwecken vollumfanglich 
eingegliedert sind. 

Figur 14 zeigt den Aufbau eines erfindungsgemaSen FIFO-Mddells zur Steuerung 
25 der Rekonf igurationi hierbei wird darauf hingewiesen, dass sich insbesondere 
durch die Befahigung zur Durchftihrung von SprOngen das hier prdsentierte 
Fifo-Modell von reinen Fifos aus dem Stand der Technik unterscheiden kam. Es 
wurde dennoch die per se im Stand der Technik belegte Bezeichnung verwendet, 
weil diese vom typischen, spnangf reien Betrieb eih besonders wscbauliches 
30 Bild assoziieren lafit. Diese Einheit 1st optional zu alien,, insbesondere den 
in dieser Anmeldungen beschriebenen, rekonfiguierbaren Zellen (PAEs) und in 
Figur 4 als Einheit 0406 dargestellt.. 

Bin Speicher 1401 enthait die Ronfigurationsdaten ftbc die zugeordnete PAE. 
1402 ist der Konfigurationsdatenausgang zu den Konfigvirationsregistem der 

35 PAE (0405). Hfber 1403, d.h* den Bus 0404, schreibt die Konfigurationseinhext 
Konfigurationen in den Speicher, die jeweilige Adresse wird durdki den 
Schreibzeiger (1407) generiert, der pro Schreibvorgang urn den Wert 1 
verdndert wird, je nach Arbeitsweise des FIFOs inkrexnentell oder 
dekrementell . Bin Startadress-Pointer (1404) zeigt auf den ersten 

40 Konf igurationsdateneintrag im Speicher, wfthrend ein weiterer Pointer (1405) 
auf den zu lesenden, bzw. an die PAE zu ttbertragenden, 

Konf igurationsdateneintrag zeigt. 1405 wird mit jeder Datentlbertragung aus 
dem Speicher an die PAE urn den Wert 1 verandert, je nach Arbeitsweise des 
FIFOs inkrementell oder dekrementell. Die DatenfSbertiragung findet so lange 
45 statt, bis das Ende der Konfiguration von einer 

Konfigurationsendeerkennungseinheit (1409) erkannt wird, beispielsweise 
anhand eines CycleBits oder Befehls (WAIT, END) . 
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Der reaXlsierte FIFO enteprlcht nicht den nomalen FIFOs nach dem Stand der 
Technik, die nur den Pointer 1405 aufwelsen. Die Modifikation ermagliicht das' 
Les.en beliebiger Konf igurationsdaten aus dem Speicher, wcQirend durch den 
^ Pointer 1404 verhiiidert wlrd, dass evti; noch bentttigte Konficniratiohsdateh 
5 liber schrieben verden. Dies geschieht durch das Erzeugen elnes Full-Flcigs 
durch den Vergleich (1406) des Startadress-Pointers 1404 rait dem 
Schreibzeiger (1407) . Wenn der Speicher voll ist, werden Schreibversuche der 
Konf igur at ions einheit zurClckgewiesen, dies kann bevorzugt durch das aus 
PACTIO bekannte ACK/RBJ-Protokoll erfolgen. Der Vergleicher 1406 gibt dazu an 
10 seinem Ausgang 1416 eln entsprechendes Reject-Signal an die - 
Xonfigurationseinheit ai^ bzw. gibt kein Ack aus. 

Ein beispielhafter Speicherinhalt von 1401 ist mit 1408 gezeigt. Der Speicher 
enthait 5 Konf igur at ionen (C0..C4). 1404 zelgt als Startpointer auf die erste 
15 Konfiguration CO. In diesem Beispiel zeigt 1405 auf den Beginn von 

Konfiguration C3. Die Zeigerposition berechnet slcb aus dem Wert von 1404 
plus der LSnge der Konfiguration CO plus der L&age der Konfiguration CI plus 
der lidnge der Konfiguration C2. 

20 Eingehende Trigger (1431) werden fiber eine in Figur 14a dargestellte 

Ubersetzungs- und Zuweisungseinrichtung (1432) auf Selekt-Signale (SCO..n, 
1433) tlbersetzt, die die Acbressierung der Konf igurationsdaten im speicher 
steuem. Diese Obersetzxings- und Zuweisungseinrichtung Icann fest vorgegeben 
ihre Zuweisung vomehmen, ist aber bevorzugt wShrend der Abarbeitung einer 

25 Konfiguration verSnderlich, wozu geeignete Rtlckkopplungen# Slgnalleitungen 
etc. vorzusehen sind. Besonders wenn die t)bersetzungs- und 
Zuweisungseinrichtung verdnderlich ist, wird es bevorzugt/ auch und/oder 
zusatzlich die der Zuordnung dienende Einheit 1434 wShrend der 
Datenvercurbeitung ver&iderlich zu gestalten. Auch hierzu sind entsprechende 

30 Schaltungsanordnungen vorzusehen, wobei die VerSnderung der Zuordnimg 
insbesondere progransngesteuert ablaufen kann. Eine entsprechende, 
insbesoiidere progranmgesteuerte Ver&:iderung ist auch f Or . die Einheit 1414; . 
d.h. das Adressberectinungsadditionskettemaittel m^lich. Die diese 
Aktualisierung und/oder neue Verbal tensweisen auslOsenden Bef ehle werden 

35 bevorzugt in der Speicher einheit 1401 hierfOr abgelegt. 

i7e ein Register (1411), ein Addierer (1412) und ein Nullgenerator (1413), 
hier beispielhaft realisiert durch eine bitweise Und-Punktion, bilden ein 
Glied einer Kette (1414) zur Adressberechnung. Je ein Glied verwaltet den 

40 Offset einer Konfiguration. Die Aneinanderreihxmg der Glieder entspricht der 
Aneinanderreihung der Konfigurationen im Speicher 1401. Mit anderen worten 
wird entsprechend des Beispiels 1408 das erste Glied die Lange der 
Konfigxiration CO aufweisen, also den Offset der auf 1404 addiert werden muss, 
um auf die Konfiguration CI zu zeigen. Das zweite Glied weist die Z»ange der 

45 Konfiguration CI auf, also den offset der auf den Offset von CO und axif 1404 
addiert werden muss, urn auf die Konfiguration C2 zu zeigen. Das dritte Glied 
weist die hSLoge der Konfiguration C2 auf, also den Offset der auf den Offset 
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von CO und auf den Offset von CX und auf 1404 addiert werden xnuss, \m auf die 
Konfiguration C3 2u zeigeri. Uiid so waiter. 

Ea wird anhand der AusfOhrung ersichtlich, dass eine Kette von Additionen 
entstehti deren Oliederanzahi der -Position der Konfiguration im Speicher 

. 5 entspricht. Dies wird durch die Kette 1414 wie foXgt realisiert: 

tteer den Addierer wir jeweils der im Register gespeicherte Wert, also die 
LSnge der jeweiligen Konf igxiration, zu dem Ergebnis des vorherigen Gliedes 
dazuaddiert. Der Wert am Eingang der bitweisen tind-Funktion wird mit alien 
Ergebnisbits des Addierers verundet. 1st der Eingang also gleich 0, liefert 

10 die Ttod-Funktion eine BinSxe 0 am Ausgang, urn die Addiererkette bei der 
auszuwahlenden Konfiguration abztOxcechen, ansonsten den Wert des 
Addierersausgangs . 

Mit anderen Worten ist in die Register (1411) die Gr5fie der Konfiguraticmen 
15 in ihrer Reihenf olge im Speicher (1401) eingetragen. Die Selektsignale sind 
derart auf die Null-Geheratoren gefttort, dass die Konfigurations-GrOSen bis 
zur Startadresse der durch die Trigger (1431) referenzierten Konfiguration 
aufaddiert werden. 

20 Somit addiert die Kette alle hSmgen von Konfigurationen, die vor der zu 

ladenden Konfiguration im Speicher 1401 liegen. Damit bildet sich ein Offset, 
der durcOi Addition (1415) mit der Startadresse (1404) auf die zu ladende 
Konfiguration zeigt. 

25 Die beschriebene Schalttmg ist besonders leistungsfahig, da sie die 

Beredhnimg des Offsets, und den Sprung Innerhalb eines Taktes ermDglicht. 

In einer zweiten optionalen Kette (1421) kOnnen in Registem (1422) Bef^e 
an die Kohfigurationseinheit und/odsr die PAB imd/oder den 

30 Konfigurationsstack gespeichert werden. Bine Null funktion (1423), bier 

ebenfalls beispielhaf t entsprechend der NUllfunktion 1413 realisiert, liefert 
eine BinSre 0 in an ihrem Ausgang, sofexn das Selekt-Signal nicht aktiv ist, 
d h^ die konfiguration niclit ausgewShlt wtirde, ansonsten den Regis terinhalt 
(1422), also den Befehl. tJber eine Oder-Kette (1424) werden alle Null - 

35 Funktionsausgange miteinander verodert, sodass der Bef^ im Register 1422 
der aktuell selektierten Konfiguration am Ausgang (1425) der Kette anliegt. 

Der Befehl kann nunmehr zum Iieschen von Eintragen im Speicher (1401) dienen, 
d.h einer der mOglichen Befehle kann sein, dass bestimmte gespeicherte 

40 Konf igurationen gelttscht werden sollen bzw. zum Oberschreiben freigegeben. 
Dies kann z.B. durch den Befehl FL0SH erfolgen, der den Startzeiger (1404) 
mit dem Lesezeiger 1405 ladt und somit alle vor dleser Adresse liegenden 
Daten zum tJberschreiben freigibt. Dies ist insofem bevorzugt, als die so zu 
tiberschreibenden Konf igurationen im fifoartigen Speicher i.d.R. alter sind 

45 und daher typisch tiberschrieben werden kdnnen, wahrend die jOngeren 

Konf igurationen, die of tmals noch bentttigt werden, weiter oben im quasi 
fifoartigen Speicher liegen werden. Bin weiterer bevorzugt impleroentierter 
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BefehX ist/ dass neue Konflguratlonen geladen werden sollen; dies ist daxm 
" wichtig, wemi das .Erfordernis, eine bestiirante neue Koniflguration zu 

ben&tlgen, mit einer zumindest nicht geringen Wahrscheinlichkelt vprhergesagt 

werden kazm. Dleser Be£ehl ]cann an elhe zentrale 
5 Konfiguratioasverwaltungseinheit oder dergl, abgegeben werden; die 

Direktladung ist gleichfalls mOglich, etwa bei Zuordnung von I/O- 

Mdglichkeiten. Auch ist es. bevorzugt, wenn sowohl der 

Konfigurationsanfordenangsbefehl als auch der Pliieh- bzw. 

Altkonf igurationspreisgabebef ehl siiaultan . axisftlbrbar und/oder . speicherbar 
10 sind. Es sei erwahnt, dass derartige Bef ehle wie Plush, Laden oder 

Flush/Laden auch in anderen Speicherbereichen bzw. -elnheiten wie etwa 1401 

ablegbar sind md daftir nicht zwingend eine dedizierte Eixiheit wie 1421 

vorzusehen ist. Diese Verwendung einer per se bereits vorhandenen Binheit 

kaim hardw£u:emMj^g bevorzugt sein. 
.15 ^" '' ' 

Weiterhin kazm der Befehl tlber das Bussysten nach Figur 13 an die 

Konfigiirationseinheit gesendet werden (1426) . Beispielsweise kann der Befehl 

dort den Start einer bestiiranten Konfiguration auslGsen und/oder das Vorladen 

einer Konfiguration bewirken. 

20 

FIiUSH, also das LOschen von Konfigurationen ist einer der wesentlichen 
bevorzugten Bef ehle der Einheit. Einerseits ist der Befehl sehr vorteilhaft 
ftlr die AusfOhrung, andererseits weist er das Problem auf , dass sich bei 
dessen AusfiUir\mg s&ntliche Adressen und Referenzen ver&idem. 

25 Der FIFO wird "gef lushed" , indem der StartPointer (1404) aixf eine neue 

Startadresse gesetzt wird. Diese wird wie in Pig. 14 daxgestellt bevoraugt 
auf den Beginn einer gespeicherten Konfiguration gesetzt, wobei der Beginn 
durch die vorab beschriebene Berechnung ndttels des Offsets bestimmt wird. 
Altemativ oder zusktzlich kcuxn der izeiger atich auf einen bestiznaten axideren 

30 Wert z.B. eine an den FLUSH-Befehle gekoppelte Konstante gesetzt werden. 
Weiterhin mttssen die beiden Ket ten 1414 und 1421 •gefltashed" werden, damit 
die Adfessberechnung der geftnderten Positionen der Konfigurationen im 
Speicher 1401 entspricht. Dies geschieht jeweils durch (in Figur 14 nicht 
eingezeichnete) Multiplexer (1451) , durch die die Registerdaten derart 

35 vorwartsObertragen werden, dass die nimmehr leeren (*geflushten*) Glieder der 
Kette mit den Daten der nachfolgenden Olieder tlberschrieben werden, und zwar 
derart, dass a) die Reihenfolge der Daten in der Kette unverandert bleibt imd 
b) das erste Olied der Kette mit neuen Daten belegt ist und c) alle weiteren 
Daten in ihrer Reihenfolge linear und ohne Ltlcke in die Glieder nachfolgend 

40 dem Ersten geschrieben sind, vgl. hierzu Fig. 14a Es sei darauf hingewieaen, 
dass Ober die Multiplexer 1451 auch Daten betref fend die Konf igurationsgrO&e 
von auSen an die entsprechenden Stellen (Size of Config 1. .n) geschrieben 
werden kOnnen. Es ist dabei abzuschatzeh, aber aus GrOnden der 
ZeichnungsObersichtlichkeit nicht dargestellt, dass jede Stelle einzeln 

45 ansprecbbar bzw. adressierbar ist. Verwiesen wird insoweit auf die in 1434 
dargestellte Binheit 1435, die diese Stelle jeweils bestixnmt. 
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Durch die Verschiebung Innerhalb der Ketten sind nxmmehr die Selekt-Signale 
(jscb. .n) an die neue Lage der Daten in den Ketten anzupaffsen; damit wieder 
eine korrekte Zuordnung der Selekt-Signiale. zu der offsetberectavmg entsteht. 
br\mdsatzlich steh^ dazu mehrere Methodien zur Verfttgung. Beispielsweise 
5 kOnnen 

a) Signale nach 1432 in 1434 binSr kodiert (entsprechend der Funktion eines 
74LS148) werden, ein Offset, der der durch Plush entstandenen Verschiebung 
entspricht, wird subtrahiert und der entstandene Wert wird wieder dekodiert 
(entsprechend der Funktion eines 74LS139) um die Selekt-Signale 1433 zu . . 

10 generieren; 

b) Signale nach 1432 in 1434 mittels einer Lookup-Tabelle auf die Selekt- 
Signale 1433 Obersetzt werden. Dazu ist die Lopkup-Tabelle der durch Flush 
veranderten Positionslage in den Ketten anzupassen. 

15 Eih besonders bevorzugtes Verfahren fttr die tJbersetzung der Signale soil 
detailliert beschrieben werden und entspricht der in 1434 eingezeichneten 

Vorrichtung: 

Ein erstes Schieberegister (1435) enthait als einen Bin-Bit~Wert die Position 
des aktuell ersten freien, also uzibenutzten, Gliedes in den Ketten 1414, 

20 1421. Dies geschieht f olgenderinaJSen : Nach einem Reset wird das 

niederwertigste Bit im Schieberegister auf 1 gesetzt (dargestellt durch einen 
gefailten Kreis) . Das niederwertigste Bit (Bit 0) wird auf das unterste Olied 
in den Ketten referenziert. Mit jedeiu Schreibzugriff auf die Ketten, also mit 
jedem neueii speichem (FILL) einer Konf iguration nach 1401 schlebt das 

25 Schieberegister 6bls gesetzte Bit (P&ZT) um eine Position in Richtung des 

hOchstwertigen Bits und referenziert damit auf das jeweils nachfolgende Glied 
in den Ketten. Das hdchstwertige Bit referenziert somit auf das hiJchste Glied 
in den Ketten, also ist das Schieberegister so breit wie Glieder in den 
Ketten vorhanden sind, Mit jedem FLtJSH schiebt das Schieberegister das Bit 

30 (PBIT) um genau so viele Positionen wie Glieder in den Ketten geldscht wurdeh 
in Richtung des niederwertigen Bits. 

Die Obersetzungs- und Zuweisungseinrichtung (1432) tibersetzt bei der PAS vom 
Bussystem (0105a, Fig. 4) eing^ende Triigger derart, dass je Trigger ein 

35 genau ein Signal des ausgehenden Busses (1437) gesetzt ist- Jedem Signal ist 
ein Schieberegister (1436) derselben Gr5Se wie 1435 zugeordnet, Es sind also 
eine Vielzahl von Schiebergistem 1436 (vorliegend dargestellt 1436a. . .1436c) 
vorhanden, wobei der en Anzahl der Anzahl der maximal zulHssigen 
unterschiedlichen Triggersignale entspricht \uid deren LSnge d.h. Bitbreite 

40 der Anzahl der maximal zul&ssigen Konfiguratlonen entspricht, also der Anzahl 
der Kettenglieder entspricht, Beim neuen Speichem einer Konf iguration (FILL) 
wird der Inhalt von 1435 vor dem Verschieben von PBIT in das Scheiberegister 
(1436) geschrieben, auf das der, der Konf iguration zugeordnete, Trigger 
zeigt; dargestellt durch einen Kreis. 

45 Bei einem Auf treten des Triggers auf dem Bus liefert das entsprechende 

tUoersetzte Signal (1437) einen 1-Wert, wahrend alle anderen Signale einen 0- 
Wert lief em. Die Signale 1437 werden jeweils an Nullgeneratoren (1438), 
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aufgebaut aus einer bitweisen Und-Punktidn geftihrt. Alle Nullgeneratoren 
deren Eingahgssignal von 1437 einetiO-Wert aufweist, lief em einen Nullvektor 
am Ausgang. Der Nullgenerator, dessen Eingangs signal von 1437 einen 1-Wert 
aufweist, CUbertr^gt den Inhalt des sichieberegisters 1436, Die Ausgfinge aller 
5 Nullgeneratoren werden miteinander verodert (143&) , sodass die Selekt-Slgnale 
SCO.»n (1433) entstehen. 

Durch diese Funktion zeigt nxinmehr ein eingehender Trigger tlber die 
Nullftmktionen auf ein Schieberegister 1436, dessen gesetztes Bit wiederijm 
10 auf ein Olied in der Ketten (1414, 1421) zeigt. 

Bei einem Flush schieben die Schieberegister 1436 gleich dem Schieberegister 
1435 den gespeichertien Wert urn genau so: viele Positionen, wie Qlieder in den 
Ketten gelOscht wurden, in Richtung des niederwertigen Bits. 1st nach dieser 
15 Operation der Inhait eines Schieberegisters gleich Null, da das PBIT Uber das 
niederwertigste Bit hinausgeschoben wurde, bedeutet dies, dass die vorznals 
referenzierte Kon£iguration gelOscht wurde. 

Liefert 1434 fte einen eingetroffenen Trigger 1431 den Wert Null am Ausgang 
20 1433, ist eine Konfigxirationsauf forderung an die Konfigurationseinheit zu 
senden, um die fehlende Konfiguration zu laden oder ggf . auch ein 
F^lerstatus an die Konfigurationseinheit zu melden. 

Die Obersetzung der eingehenden Trigger 1431 nach 1437 in 1432 kann nach 
25 mehreren Prinzipien erf olgend, die einzeln Oder gemeinsam angewendet werden 
k5nnen, beispieleweise : 

1. Dekoder entsprechend der Funktion eines 74LS148 

2. Round-Robin Arbiter (vgl. PACTIO) 

3. Lookup-Tabelle (vgl. PACTIO) 

30 Prinzipiell kann die Obersetzung dem in PACTIO beschriebenen Verfahren 
entsprechen (Round-Robin-Arbiter, LOTl) . 

Fehlt eine Obersetzungsvorschrif t, beispielsweise bei der Anwendung von 
Xiookup-Ted^ellen, ist ein^ Konfigurationsaufforderung an die 
Konfigurationseinheit zu senden, vm die fehlende Konfiguration zu laden oder 
35 ggf. auch ein Fehlerstatus an die Konfigxirationseinheit zu melden. 

Eine weitere wesentliche Funktion des Konf igurationsstacks nach Figur 14 1st 
das Seguenzen tlber Konf igurationen, was bedingte und unbedingte ^^prOnge 
innerhalb des Speichers 1401 bedeutet. Daher ist auch diese Funktion 
40 detallllert in Flgur 14b beschrleben. 

Ein Befehlsdekoder (1462) erkennt bedingte und unbedingte Sprungbefehle in 
Konfigurationsworten (1402) beim Lesen aus dem Speicher 1401. Einem 
Sprungbefehl ist als Konstante die relative Sprungadresse zur aktuellen 
45 Position zugeordnet, die von Befehlsdekoder dekodlert und ausgegeben wlrd 
(1463) . Je nach Sprungrichtung 1st der Wert positlv oder negativ. 
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Weiterhin ist als Konstante ein Vergleichswert (1469) nit den eintreffenden 
Triggem oder den Statusflags der PAE, beispielsweise die ALU-Flags zero/ 
carry, negative, overflow, etc. oder die Speicher-Flags full, einpty, etc,, 
angegeben, in Abhibigigkeit dessen bedihgte Spr^ge diurcHgeftUxrt werden. Oiese 
5 wird an eine Vergleichseinheit 1464 tibermittelt, die den Wert mit den Flags - 
(1465) und/oder Triggem, die von dem Aagang tJbersetzungs- tind 
Zweisungseinrichtung (1437) und/oder direkt von dem Bussystem 0105 stanmen, 
verglichen. 

10 Eine Steuereinheit (1466). generiert in Abhangigkeit des Befehles (bedingter : 
Oder unbedingter Sprung = "Type") und des Verglelchserg^Miisses die 
Ansteuerung fUr den Lesezeiger (1405) wie folgt: 

Unbedingter Sprmgi Generiere 'Set", um neue Adresse nadii 1405 zii laden; 
Bedingter Sprung, Vergleidi erfiOllt; Generiere "Set** / um neue Adresse nach 
15 1405 zu laden; 

Bedingter Sprung, Vergleieb nioht erftillt: Generiere "Count", um Adresse des 
nachfolgenden Bef ehles in 1405 zu berechnen. 



Das Setzen einer neuen Adresse geschieht durch Aufaddieren (1468) der 
20 relativen Sprungadresse (1463) zum aktuellen Wert von 1405. Ober einen 

Multiplexer (1467), der zwischen der aufaddierten neuen Adresse und der von 
1415 generierten Startadresse von Konfigurationen (1461) auswShlt, wird die 
neue Adress bei Anliegen von "Set" in den Les^pointer 1405 gescbrieben* 

25 Die Arbeitsweise des Konf igurationstacks nacht die Verwendung von 

Konfigurationselnheiten (CT) wie aus PACTIO und PACT17 belcannt weitgebend 
oboslet, vielmehr ist eine verteilte, parallele CT durch die 
Konfigxxrationsstaclcs entstanden. 

Zwei Aufged>en der CT kdnn^ dabei jedoch bei einer solchen Biiiheit 
30 verbleiben: 

1. Das Laden der Konfigurationen aus einem Speicher, der chipintem oder 
-extern inplementiert sein kann, als flOchtiger. oder nicht flOchtiger 
(ROM, EPROM, BEFROM, Flash-ROM, etc) Speicber ausgestaltet sein kann 

35 und/oder ein Miassenspeicher sein kann. Dies kann nunmehr durch einen 

einfachen Mikrokontroller erfolgen, der Daten an die PAEs sendet und 
auf die zurtlckgemeldete Quittierung reagiert. Beiepielsweise Icann 
bevorzugt die Einheit aus PACT05 als Mikrokontroller bzw. der in 
PACT05 beschriebene Algorithmus eingesetzt werden. Das Lade n mufi nicht 

40 mehr zwingend aktiv geschehen, sondem es ist ausreichend, wenn eine 

Binbeit vorhanden ±at, die auf das Konfigurationsanforderungskommando 
das Hereinholen der neuen Konfigurationsdaten in die jeweilige PAS 
bzw. deren zugeordneten Konfigurationsspeicher veranlasst. Dies kann, 
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etwa bel den vorstehend diskutierten I/O-PAEs auch jene PAB selbst 
; seih, die d^zeit: nieue.Koziflgur 

2 . Die verbleibende Resteinheit Xann verweiidet werdeh, um 

5 sicherzustellen, dass Rekonfigurationstrigger (WCT) in einer 

bestintmten Reihenfolge sortiert durch das Array laufen imd/oder 
vorgeladene Konfigtirationen in der erf order lichen Reihenfolge 
abgearbeitet werden \md/oder noch nicht geladene, aber bendtigte 
Konfigurationen wie erforderlich angef ordert und /oder geladen werden. 

10 Diese Relconfigtirationstriggerpriorisiening kann dazu verwendet werden, 

zu Priorisieren, auf weXchen Rekonf igurationsanforderungstrigger 
zuerst reagiert werden soil. Dies stellt die konfliktfreie Abarlaeitung 
untexTSchiedlicher, aidglicher Konfigviratlonen siqher, indent ibdiglich 
festgelegt wird, welcher Trigger zunclchst durch das Array lauft. Wenn 

15 ein solcher Trigger eine bestinmte PAE betriff t, die auf diesen 

Trigger reagieren soil, wird sie sich dies merkeni vm dann als 
nSLchstes auf diesen Trigger reagieren zu kOnnen, sobald sie 
rekonfiguierbar ist. Es sei erwahnt, dass bevorzugt die einzelne Zelle 
Oder ein Zellgebilde oder dergl. nicht nur jene Trigger vormerkt, die 

20 unmittelbar nachf olgend abzuarbeitende Konfigurationen betref f en, 

sondem dass auch alle weiteren oder wenigstens mehrere, von dieser 
Zelle kQnf tig abzuarbeitenden Konfigurationen in Ihrer Reihenfolge 
abgelegt werden kOxmen und/oder sollen, so dass jede Zelle oder 
Zellgruppe die Information aus den Triggervektoren erh£Ult und behait, 

25 die sie zxiJcOnftig und/oder aktuell betrif ft. Damit wird die Filno- 

Fiinktion der frOheren CT QberflOssig und durch den Zeitverlauf der 
Triggervektoren im wesentlichen ersetzt. 

3. Sofexn nur ein Rekonfigurationstrigger verweiodet wird; sind keine 
30 besonderen MaSnahmen erforderlich. Wenn mehrere 

Rekonfigurationstrigger (WCT) auftreten kOnnen, mtlsisen diese ohne 
zeitliche Oberlagerung, also nacheinander in fester Reihenfolge und 
kreuzungsfrei durch das Array laufen, um Deadlocks zu verhindem. 

35 Die kann durch das in Figur 16 deurgestellte Verfahren sichergestellt werden, 
bei welchen durch Routing-MaSnahmen fOr eine korrekte zeitliche Weiterleitung 
von WCT zu sorgen. Von einer zentralen Instanz (1603) werden mehrere WCT ftir 
verschiedene PAEs (1601) generiert, die jedoch zeitlich aufeinander 
abgestimmt sein sollen. Die unterschiedlichen Entfemungen der 1601 in der 

40 Matrix ftlhren zu unterschiedlichen Iiaufzeiten, bzw. Latenzzeiten. Dies wird 
in dem vorliegenden Beispiel durch das geeignete Einsetzen von Pipelinestuf en 
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(1602) durch den, dem Costpiler zugeordneten Router, errelcht (vgl. PACT13) . 
Die sich dadurci ergebenden Latenzen sind mit di-d5 angegeben. Es ist 
ersichtlichi dafi in Richtung des WCT-Plusses (1604) in jeder Stufe (Spalte) 
dieselben Latenzen auf tr^teh. Beispielswelse ware 1605 nicht notwendig, da 
5 die Bntfemung von 1606 von 1603 sehr gering ist. Da aber £0r 1607 und 1608 
je ein 1602 au£grund der durch die l^gere Distanz entstehenden Laufzeit 
eingefttgt werden imifi, wird 1605 zum Abgleich der Laufzeit notwendig. 
Die zentrale Xnstanz 1603 nimmt von den PAEs eingehende 

Rekonfigurationstrigger (1609) auf und priorisiert diese, urn sie dann jeweils 
10 einzeln und nacheinander als WCT an das Array aus PAEs zu senden. nit 

anderen Worten sendet.eine PAE, die einen Rekonfigurationstrigger generiert, 
diesen nicht direkt an andere PAEs weiter, sondem ausschlie£lich an die 
zentrale Instanz 1603, 

IS Die zentrale Xnstanz speichert eingehende Trigger und priorisiert diese. Dazu 
kann bevorzugt das aus PACTIO bekannt Verfahren des SCRR-ARB verwendet 
werden, wie es in Pigur 8 PACTIO ausftlhrlich beschrieben ist. 
samtliche erweUinten PACT-Schutzrechte sind zu Offexibarungszweclcen 
vollumf&iglich eingegliedert. 
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Titel: 
S PatentansprQche 

1. Zellementefelcl zur Datenverarbeitung mit Funktlonszellen zur Ausfflhrung 
sdgebraischer und/oder logischer Funktionen und Speicherzellen, urn 
Information zu exnpfangen, abzuspeichem und/oder auszugeben, dadurch 

10 gekennzeichnet/ 6a& von dien Funktlonszellen elne Steuerverbindung zu den . 

Speicherzellen gefOhrt 1st. 

2. Zellementefeld nach dem vorhezgehenden. Anspruch, dadtzrch gekennzeichnet, 
dafi ein ProzesBor, Coprozessor und/oder Microcontroller mit eiher 

IS Vielzahl in Funk t ion und/oder Verne tzung rekonfigurierbarer und/oder 

vorgebbarer Einheiten wie Funktlonszellen und/oder Speicherzellen blldet. 

3. Zellementefeld nach elnem der vorhergehenden AnsprUche, dadurch 
gekennzeichnet, dafi die Funktlonszellen als arlthsietlsche Loglkelnhelten 

20 geblldet slnd. 

4. Zellementefeld nach deoL vorhergehenden Anspruch, dadurdh gelcennzelchnet, 
da& die arlthmetlschen Loglkelnhelten als erwelterte ALUs geblldet sind. 

25 5. Zellementefeld nach elnem der vorhergehenden AnsparUche, dadurch 

gekennzeichnet, daS die Speicherzellen zur flOchtlgen und/oder nicht 
flttchtigen Datenspeicherung ausgeblldet slnd. 

6. Zellementefeld nach elnem der vorhergehenden Ansprflche, dadurch 
30 gekennzeichnet, da£ die Speicherzellen zur Abspelcherung von zu 

verarbeltenden Daten und/oder von zu verarbeitenden Programmschritten 
ausgeblldet sind. • ; 

7. Zellementefeld zur Datenverarbeltung, dadurch gekennzeichnet, daS die 
35 speicherzellen dazu ausgeblldet sind, abgespelcherte Informationen auf 

Ansteuerung der sle steuemden Funktionezelle direkt und/oder Indirekt 
auf elnen zur Funktlonszelle fOhrenden Bus zu geben. 

8. Zellementefeld nach elnem der vorhergehenden Ansprtiche, worin zumlndest 
40 elner Spelcherzelle und/oder Funktlonszelle Register zugeordnet slnd, 

Insbesondere ein Baclcward-Register, welches im Informationsweg zwlscdien 
l^eicherzelle und Funktlonszelle angeordnet ist. 

9. Zellementefeld nach einem der vorhergehenden Ansprtiche, dadurch 

45 gekennzeichnet, daS die Spelcherzelle dazu angeordnet 1st, Informationen 

von der sle steuemden Funktlonszelle, elner Elngabe-Ausgabe'-Zelle 
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10 



und/oder einer sie nicbt steuernden Zelle nit arithmetischer Iiogikeinheit 
. zii eii^fangen.- **'.•' 

10^ Zelleme&tefeld nach einem der vorhergehenden AnsprOche, dadurch 
gekennzeichnet, daS der Funktionszellen-Speiclierzellen-Kombination 
zumindest ein Ein-Ausgabe-Mittel zugeordnet ist, um Informationen an eine 
exteme Elnheit imd/oder eine andere Funktionszelle, Funktionszellen-* 
Speicherzellen-Kcanbination und/oder Speicherzelle zu senden und/oder von 
dieser zu en5>fangen. 

11. ZellementefeXd nach dera vorhergelienden Anspruch, dadurch gekennzeichnet, 
daS das Ein-i\usgabe-KitteI gleichfalls zuxq Bnipfang von Steuerbefehlen . 
aus der Funktioniszelle ausgebildet ist. 

15 ' 12. Zeilemehtefeld nach einem der vorhergehenden Anspartlche, dadurch 

gekennzeichnet, dafi die Steuerung dazu ausgebildet ist, zumindest 
einige, bevorzugt alie der nachfolgenden Befehle zu tlbertragen und/oder 
die £fpeicherzelle bzw. Eingabe/Ausgabe- Zelle dazu ausgebildet ist, die 
folgenden Befehle zu delcodieren: DATA WRITE/READ, ADRESSPOINTER 

20 WRITE/READ, PROGRAMMPOIOTER WRITE/READ, PROGRAMMPOINTER INCREMENT, 

STACKPOINTER WRITE/READ, vorgenannte Befehle jeweils insbesondere fOr 
inteznen und/oder extemen Zugriff, PUSH, FOP, OPCODE, FETCH. 

13. Zellementefeld nach einem der vorhergehenden Ansprttche, dadurch 

25 gekennzeichnet, dafi die Punlctionszelle als alleiniger Master auf die 

Steuerverbindung und/oder das als Steuerungsverbindung dienende 
Bussegment zugreifen kann. 

14. Zellementefeld zxir Datenverarbeitwg nach einem der vorherg^enden 
30 AnsprOche, dadurch gekennzeichnet, daS die Funktionszelle zumindest 

einer von Speicher zelle und Ein-Ausgabezelle benachbart ange6r<toet ist. 

15. Zellementefeld nach einem der vorhergehenden AnsprHche, dadurch 
gekennzeichnet, daS die Zellelemente multidimensional angeordnet sind, 

35 insbesondere matrixartig, wobei die Funktionszelle und/oder die 

benachbarte Speicher- bzw. Ein-Ausgabezelle aus einer oberen Reihe Daten 
enipfangen und in eine untere Reihe Daten ausgeben kann, wobei in einer 
Reihe Busse vorgesehen sind nnd die Funktionszelle und zumindest eine 
Speicher- und/oder Bin-Ausgabezelle in ein und derselben Reihe liegen. 

40 

16. Verfahren zum Betrieb eines Zellelementefeldes, insbesondere 
multidimensionalen Zellelementefeldes mit Punktionszellen z\ir Ausfdhrung 
algebraischer und/oder logischer Pimktionen und 

Informationsbereitstellungszellen, insbesondere Speicherzellen und/oder 
45 Ein-Au8ga3^zellen zum Bnpfangen und/oder Ausgeben von Informationen 

und/oder Speichem derselben, dadurch gekennzeichnet, daS z\]mindest eine 
der Funktionszellen Steuerbefehle an ziimindest eine 
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Informationsbereitstellungszelle ausgibt, dort Im Aasprechen au£ die 
.Steuefbefehllnfoinnatiibn fto die Punktionszelle verarbeltet wird imd.die 
Funktionszelle dazu ausgebildet iet, eine weitere Datenverarbeitung im 
Ansprechen au£ aus der ihfoznk^tionsbereitstellunigszeXie bereitgestellte 
5 Infoxination durchzufOhren* im so seguenzerartig Daten zu verarbeiten. 

17. Verfahren nach einem der vorhergeheziden Ansprttche, dadtirch 

gekennzeichnet, Qa& die Punktionszelle dazu ausgebildet ist, zumindest 

einige der Steuerbefehle 
.10 OPCODE FETCH, 

DA.TA WEUTB INTERN, 

OATA WRITE EXTERN, 

CtATA READ INTERN, 

DATA READ EXTERN, 
15 ADRESSPOINTER WRITE INTERN, 

ADRESSPOINTER WRITE EXTERN, 

ADRESSPOINTER READ INTERN, 

ADRESSPOINTER READ EXTERN, 

PROGRAMMPOINTER WRITE INTERN, 
20 PROGRAHMPOINTER WRITE EXTERN, 

PROGRAMHPOINTER READ INTERN, 

PROGRANtfPOINTER READ EXTERN, 

STACKPOINTER WRITE INTERN, 

STACKPOINTER WRITE EXTERN, 
25 STACKPOINTER READ INTERN, 

STACKPOINTER READ EXTERN, 

PUSH, 

POP, 

PROGRAMMPOINTER INCREMENT 
30 ausgibt und im Laufe Zellementbetriebs zumindest eixiige, insbesondere 

alle der oben genannten Steuerbe£ehle wie erforderlicb ausgibt. 



18. Datenverarbeitungsanordnung mit einem multidimensionalen 
35 Feld 

in Function und/oder Vemetzung konf igurierbarer Zellelemente und 
dies en zugeordneten Konf igurationsvorhaltemitteln zum lokalen 
Konf i gura ti ons -Vorhal ten , 
dadurch g e k e n n z e i c hn e t , daS 
40 die Kon£iguration8Vorhaltemittel dazu avisgebildet sind, 

zumindest einen Teil der vorgehaltenen Konfigurationen 
nichtflOchtig vorzuhalten. 

19. Datenverarbeitungsanordnung mit einem multidimensionoden 
45 Peld 

in Funktion und/oder Vemetzung konf igurierbarer Zellelemente und 
diesen zugeordneten Konf igurationsvorhaltemitteln z\im lokalen 
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Kon f igur a t i ons -Vorhal t en , 
. dadurcii g e k e nxi z e i c hn e t r d a B 
die Konf igurationsvorhaltemittel dazu ausgebildet aind, 
alle vorgehaltenen Konf igriratlonen 
S nlchtfXUchtig vorzuhalten. 

20. Datenverarbeitungeanordnung nach einem der vorhergehenden 
DatenverarbeitungsanordnungsansprUcher dadurch gekennzeichnet, da£ die 
Funktlon grobgranular konf igurierbar ist. 

10 

21. Datenverarbeitimgsanordnuzig nach einem der vorhergehenden 
Datenverarbeitungsanordnungsansprttche, dadurch gekennzeichnet, daS die 
Vemetzung grobgranular konf igurierbar ist. 

15 22 . Datenverarbeitxmgsianordnung nach eihem der vbrherg^ehden 

Datenverarbeitungsanordnungsansprttche, dadurch gekennzeichnet, daE als 
Zellelemente zumindest eines von ALUs, EAlUs, RAM-Zellen, I/O-Zellen, 
LogiblOcken vorgesehen sind. 

20 23. Datenverarbeitungsanordnung nach einem der vorhergehenden 

DatenverarbeitungsanordnungsansprUche, dadurch gekennzelchnet, daB jedem 
Zellelement ein eigenes Konfigurationsvorhaltemittel zugeordnet ist. 

24. Datenverarbeitungsanordnung nach einan der vorhergehenden 

25 Catenvereurbeitungsanordnungsansprtlche, dadurch gekennzeichnet, daS die 

Konfigurationsvorhaltemittel dazu ausgebildet sind, eine Vielzahl von 
Konfigurationen vorzuhalten. 

25. Datenverarbeitungsanordnung nach einem der vorhergehenden 

30 DatenverarbeitxmgsanordntmgsansprOche, dadurdh gekennzeichnet, daS 

mehrere fest vorgegebene nichtf lUchtige Konf igurationen ia 
Konfigiirationsvorhaltexoittel vorgegeben sind. 

26. Datenverarbeitungsanordnung nach einem der vorhergehenden 

35 Datenver£u:beitungsanordnungsansprache, dadurch gekennzeichnet, da£ die 

Anordnung dazu a\isgebildet ist, eine wechselnde einer Vielzahl von 
vorgehaltenen Konfigurationen zu verwenden, insbesondere im Wege der 
Wave-Rekonfiguration Oder des lokalen Sequencing. 

40 27. Datenverarbeitungsanordnung nach einem der vorhergehenden 

DatenverarbeitungsanordnungsansprUche, dadiurch gekennzeichnet, 6sl& bei 
einigen Zellen im Betrieb mit verSnderlichen Konfigurationen versebbeure 
Konfigurationsvorhaltemittel vorgesehen sind. 

45 28. Datenverarbeitungsanoardnung nach einem der vorhergehenden 

Datenverarbeitungsanordnungsansprache, dadurch gekennzeichnet, daE als 
Konfigurationsvorhaltemittel zunmindest eines aus ROM, BPROM, EEPR0M, 
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Flash- Speicher, Fuse-, totifuse-prograinmierbare Speichermittel und/oder 
. in insbesondere in oberea Lagen . einer Siliziumstruktur fest vorgee6h«ae 

Speichermittel gewahlt sind. 

5 29. Verfahren z\ir Herstelliing einer dedizierten 

Datenverarbeitungsanordnung, dadurch gekennzeichnet, dafi eln 
multidimensionales Feld mit in Function und/oder Verne tziuig 
konf igurierbaren Zellelemente iind diesen zugeordneten 
Konfigurationsvorhaltemitteln zum lolcalen Konf igurations-Vorhal ten 

10 vorgegeben wird, bestimmt wird, welche Konfigiiratioxien in diesen 

vorzuhalten sind, und dann nichtf lUchtige Konfigurationsvorhaltemittel 
so vorgesehen werden, da£ sie zumindest einen Teil der vorgehaltenen 
Kon£igurationen nichtflUchtig vorbalten. 

15 30, Verfahren nach dem vorhergehenden Datenverarbeitungsanordnungsanspruch, 
dadurch gekennzeicbnet, dafi von einem anir laufzeitrekonf igurierbsuren 
maltidimensionalen Feld ausgegangen wird. 

31. Verfahren nach dem vorhergehenden Datenverarbeitiingsanordnungsanspshich, 
20 dadurch gekennzeicbnet, daS zunachst von einem zur 

laufzeitrekonf igurierbaren nniltidimensionalen Feld mit 
Rekonfigurationsbeschaltung ausgegangen vird und daim fOr 
Rekonfiguxation nichtbenOtigte Felder weggelassen werden* 

32 . Datenverarbeitungsanordnung, Insbesondere nach einem der vorhergehenden 
25 Ansprache, insbesondere Frozessor, mit einem Feld aus zur Ziaufzeit in 

Funktion und/oder Vemetzung datenverabeitenden rekonf igurierb£u:en 
Zellen, denen Speicher und eine Sequenzersteuerung zugeordnet ist, 
dadurch gekennzeicbnet, dafi die Steuerung derart ausgebildet ist, daJS 
sich ein vollstandiger und/oder limltierter Befehssatz ergibt. 
30 . 

. \ 33 Datenverarbeitungsanordnung, insbesondere nach ei n em der 

vorhergehenden AnsprQche, insbesondere Prozessor, mit einem Feld aus 
zur Iiaufzeit in Funktion und/oder Vemetzung datenverabeitenden 

35 rekonfigurierbaren Zellen, mit einer ALU oder anderen logischen 

Verknttpfungsbeschaltung und dieser zugeordnetem, insbesondere 
integriertem Speicher, dadurch gekennzeicbnet, daS der Speicher in 
einer anderen Halbleiter-Lage, insbesondere oberhalb der ALU oder 
anderen logischen Verknttpfungsbeschaltxing angeordnet ist. 

40 

34; Datenverarbeitungsanordnung, insbesondere nach einem der 

vorhergehenden AnsprUche, insbesondere Prozessor, mit einem Feld aus 
zur Laufzeit in Funktion und/oder Vemetzung datenverabeitenden 
rekonfigurierbaren Zellen, von denen einige Speicher zwecken dienen, 
45 dadurch gekennzeicbnet, dafi diese Zellen dazu ausgebildet sind, eine 

KMO und/oder DNA - Funktion zu realisieren. 
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\ 35. batenverarbeitimgsanordnung, Insbesonde^ 

vorhergehenden Ansprttche, insbesondere Pxozessox, mit einem Feld aus 
zur Laufzeit in Funktion imd/oder Veznetzung datenverabeitenden - 
5 rekonf igurierbaren Zellen, dadurcb gekennzeichnet, daiS wenigstens 

elne, bevorzugt zuxoindest elnige, Insbesondere bevorzugt nlclit alle, 
Zellen eine Eingangs/Ausgangsfunktlon realisieren und bevorzugt 
zugleich eine ALU oder anderen logiscben Verkntipfiingsbeschaltiing zur 
Datenverarbeitung und/ oder -veranderung aufweisen, wobei insbesondere 
10 . . Mittel yorgesehen sind, um jedem EinganGs** und/oder Ausgangskanal eine 

definierte Adresse zuzuordnen, iind/oder wobei 
Senderidentifkationsmittel vorgesehen sind. 

36. Datenverarbeitungsanordnung, insbesondere nach einem der 

15 vorbergehenden AnsprOcher insbesondere Frozessor, mit einem Feld aus 

zur Iiaufzeit in Funktion und/oder Vemetzung datenverabeitenden 
rekonf igurierbaren Zellisn, dadurch gekennzeichnet, daS zumindest 
einige^. bevorzugt nicht alle, Zellen f eingranulare FFGA-Strukturen 
aufweisen, wahrend axidere Zellen grobgranulare Strukturen aufweisen. 

20 

37. Datenverarbeitungsanordnxing nach dem vorhergehenden Anspruch, wobei 
eine Konf igurationseinheit zur schnellen Rekonfiguration der Zellen 
vorgesehen ist, dadurch gekennzeichnet, dafi die Konf igurationseinheit 
nur zur Konf igtiration der grobgreuauleoren und/oder der Nicht- FPGA- 

25 Zellen beschaltet ist. 

38. Datenverarbeitungsanordnung, insbesondere nach einem der 
vorhergehenden Ansprache, insbesondere Prozessor, mit einem Feld aus 
zur Lauf zeit in Funktion und/oder Vemetzxmg datenverabeitenden 

30 rekonf igurierbaren Zellen zur Verarbeitung von Daten mit einer hOheren 

Bitbreite, dadurch gekennzeichnet , daS die Zellen dazu ausgebildet 
sind, wahlweise Oaten mit einer hOheren Bitbreite oder Daten mit 
geringerer Bitbreite zu verarbeiten, wobei dann mehrere Daten mit 
geringerer Bitbreite simultan versurbeitbar sind, insbesondere nach Art 

35 eines SIMD-Rechenwerkes . 



Datenverarbeitungsanordnung, insbesondere nach einem der 
vorhergehenden AnsprUche, nach dem vorhergehenden Anspruch, dadurch 
gekennzeichnet, dafi zur Zelle hin oder von dieser weg ftlhrende Busse 
teilbar sind, insbesondere um mehrere DatenstrOme mit geringerer 
Bitbreite als der in der Zelle maximal bearbeitbaren Bitbreite 
unabh^gig weiterleiten und/oder eiopfangen zu kdnnen. 

40. Datenverarbeitungsanordnung, insbesondere nach einem der 
45 vorhergehenden Ansprtlche, nach dem vorhergehenden Anspruch, dadurch 

gekennzeichnet, dafi die Busverwaltung lokal in der Zelle erfolgt. 
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41. Datenverarbeitungsanordnung Insbesondere aach elnem der vorhergehenden 
Ansprtlche, dadurch gekennzeichnet, daS einer PAE ein Speicher zur 
Sequenzerrealisierung zugeordnet iat und die Adressboisse als 
Telladresbusse aufteiil3ar sind. ^ 



42. Datenvereurbeitungsanordnung Insbesondere nach einem der vorhergebenden 
AnsprOche^ dadurch gekennzeichnet, dafi einer PAE ein Speicher zvr 
SeguenzerreaXisierung zugeordnet ist und eine Anordnving vorgesehen 
10 . ist, um bei Zugriff.auf eine Speichers telle, sowohl In£orxnationen 

betreffend die Adresse einer Speichers telle £tlr den nachsten 
$peicherzugri£f zu bestixnmen als auch Daten und/bder Bef ehle zu 
ermitteln. 
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